Google アナリティクスは性別をどうやって調べているのか不思議です。 関心分野から割り出しているという説明を読んだこともありますが、 彼らのやることにしては雑すぎます。 そんなことで性別は推測できません。 おそらく家庭向け体脂肪計のように、 行動から統計的な近似値を割り出しているのでしょう。 だとしたら単に閲覧履歴の追跡を許可するだけではなく、 積極的に情報を提供する被験者が世界のどこかにいるはずです。 統計の取り方によって近似値と実態の誤差は大きくなるでしょう。 ローカライズをどの程度やるかによっても変わりそうです。
企業であれ国家であれ、 個人情報をあたかも神の御業のように正しく知り、 理解するのであれば怖くはありません。 たとえば確かにわたしは尊敬や友情に値する人間とはいえません。 しかし社会に大きな危害を及ぼす能力もありません。 適切に評価されたら不利益を被ることはないでしょう。 海辺を散歩しながら与謝野晶子の詩集に線を引いた、 という情報で少女が逮捕されるのは、 危険性の評価が不適切だからです。 情報収集そのものではなく、 扱いが問題なのです。 あいにく企業も国家も神ではありません。 だれがそのように取り違えようとも。
アルゴリズムに評価の仕方や、 評価を学んで発展させる方法を教えるのは人間です——少なくとも当分のあいだは。 当然ですが人間はあらかじめ知っていることしか知り得ません。 足りない情報は経験からの推測、 すなわち統計的な近似値で埋めようとします。 しかしその統計は非常に局所的で限られたもので、 近似値を割り出す仕組みも精確ではありません。 わたしたち生身の人間は、 「あらかじめ知っていることしか知り得ない」 という制約からはどうしても逃れられないのです。 アルゴリズムが自律的な進化を重ね、 神のような世代へ到達することは、 現代に暮らすわたしたちの存命中には難しいでしょう。
当時の国家は本を読む少女を畏れました。 だれもがそのように言葉を伝え合い、 自分で考えるようになれば、 確かに彼らには不利益だったでしょう。 それこそ 「一般人ではない」 「共謀」 という評価になったに違いありません。 その扱いが誤りだったことは歴史が証明しています。 ただ当たり前に暮らしているだけのひとびとから個人情報を集めるのは容易な時代です。 そしてまた 「一般人ではない」 「テロに備える」 とはもっともな理屈です。 しかしそれらの言葉が何をどう扱うかは、 注意して対処していかねばなりません。