米国 Apple の広報担当者 Trudy Muller 氏は米国メディア Wired に対して、利用者が Siri に対して行った質問の音声データは、Apple に2年間保存されることを明かした。このインタビューにより、これまでは公開されていなかった Siri の詳細が、広く知られることになった。

Siri の音声データは2年間保存−懸念されるプライバシーの侵害
Siri の利用者の音声データは、Apple に2年間保存される

Apple は、Siri が利用者の質問をデジタル化し、分析のために Apple のサーバーにその音声データを送っていることは公表していた。しかしその後の音声データの扱いについては、明らかにしていなかった。

Siri のシステムは次のようなものだ。Siri を起動させると、Siri のアプリは質問者の音声をデジタル化し、そのデータを Apple に送る。Apple のサーバーは、音声認識ソフトウェアを使って利用者の質問を分析し、データベースの中からその質問への回答を探す。もし Siri に「ここから5マイル以内で一番良いレストランはどこか?」と尋ねれば、Siri はその質問と一緒に、利用者の居場所を Apple のサーバーに送る。

質問が Apple のサーバーに届くと、サーバーは利用者の所在地から5マイル以内の全てのレストランと、Yelp などのオンラインのデータベースにあるレイティングを探す。それからサーバーは、その圏内のレストランのリストを、そのレイティングと共に利用者に送る。

Siri はレストランやバー、スポーツなどの情報を提供するが、Siri では得られない情報も多い。私がワシントン・ナショナルズの試合の得点を Siri に尋ねれば、Siri は答えてくれるだろう。しかし Siri に、Apple が Siri のデータを保存する期間について尋ねれば、答えは決して得られないだろう。

質問者への回答が終了すると、Apple はその音声データを保存し、Siri の性能を向上させるための分析を実施する。私が Siri を試したところ、Siri は Apple がプログラムした特定の領域以外の質問には、ほとんど答えられないことがわかった。この場合、利用者は Apple に対し、単に Siri の機能改善のためのデータを提供しただけということになる。

私は、批評家が Siri に対してするべきではないとしている質問を試してみた。「飲みに行きたいんだけれど、どこがいい?」Siri はこれに対し「Wayne、あなたは今、自動車の運転をしてはいませんよね?」と答え、「タクシーを呼ぶ」と書かれたボタンを表示した。

その質問が Apple のサーバーに保存されたかどうかはわからない。保存されたとしても、実際に私がタクシーを呼んだのかが、保存されたデータから分かるのかも不明だ。でも、仮に保存されたとして、誰かが私の音声データを見たら、私がその質問をしたことはわかってしまうだろう。

もっと個人的でプライベートな内容を、例えば「離婚専門の良い弁護士はどこにいる?」などの質問をした場合はどうだろうか。このような質問が Apple のサーバーに保存されても気にならないだろうか?個人が特定される可能性は低いとしてもだ。

業務上の機密が漏れるといったケースは、私は想定していない。Siri は、複雑な質問にはこたえられないからだ。Siri は、重要な質問ではなく、レクリエーション目的での質問が一番適している。

しかしそれでも、音声データの保存に対するプライバシーの懸念が払しょくされることはない。Apple は音声データを2年後に削除すると約束しているが、それが本当に削除されたのかを確認することはできないからだ。その間、これらの音声データは、乱数による ID が付与されて管理される。Apple は、音声データは Apple ID と関連付けられてはいないと説明するが、音声データからデバイスやその声の主を突き止めることは、本当にできないのだろうか?これについて、Apple は何も述べていない。

声紋技術はまだ発達段階にあるものの、徐々に向上してきている。声紋のサンプルがあれば、録音データから誰の声かを特定することは可能だ。つまり、行政機関が個人の音声データと Siri の音声データを照合することもできる。何か問題のある質問をすれば、警察の捜査を受ける可能性もあるのだ。

さらに懸念されるのは、Apple がこれらの詳細を、iOS の利用者たちと共有していないことだ。デバイスのプライバシーポリシーにも、Apple の Web サイトにも、音声データの利用については記載されていない。Siri への質問のデータを Apple が保存することは一理あるとしても、Apple はその詳細を明確にし、利用者にデータの使われ方についての選択肢を与えるべきだ。