参照記事
マッコウクジラの鳴き声を人工知能で解釈し、会話をしようという野心的なプロジェクトがある。
「私はクジラのことをよく知りません。生まれてこのかた、クジラを見たことがありません」と、マイケル・ブロンシュタインは言う。イギリスのインペリアル・カレッジ・ロンドンで教鞭をとるこのイスラエル人コンピュータ科学者は、マッコウクジラのコミュニケーションに関わるプロジェクトには理想的な候補者とは思えない。しかし、機械学習の専門家としての彼のスキルは、2020年3月に正式に開始された野心的な試みの鍵となる可能性がある。科学者の学際的なグループが、人工知能を使って海棲哺乳類の言語を解読しようとしているのだ。CETIプロジェクト(Cetacean Translation Initiativeの略)が成功すれば、動物が何を話しているのかを私たちが実際に理解する初めて事となり、ひょっとすると彼らと会話をすることもできるかもしれない。
2017年、マサチューセッツ州ケンブリッジにあるハーバード大学のラドクリフフェローシップで、国際的な科学者グループが1年間一緒に過ごしたのが始まりだった。ラドクリフフェローシップとは、「普段の生活から離れる機会」を約束するプログラムだ。ある日、ニューヨーク市立大学の海洋生物学者デビッド・グルーバーのオフィスに、同じくイスラエル出身のコンピュータ科学者で暗号の専門家であるシャフィ・ゴールドワッサーがやってきた。カリフォルニア大学バークレー校のサイモンズ計算理論研究所の新所長に就任したばかりのゴールドワッサーは、ある一連のクリック音を聞いて、故障した電子回路が発する音、あるいはモールス信号を思い浮かべたという。それは、マッコウクジラがお互いに会話するときに使うモールス信号だった。「私は『鯨の鳴き声を人間が理解できるように翻訳するプロジェクトをやるべきかもしれない』と言いました」とゴールドワッサーは振り返る。「本当に余計なことを言ってしまった。彼が私の話を真剣に聞いてくれるとは思いませんでした」。
しかし、このフェローシップは、突飛なアイデアを真剣に受け止める機会となった。ブロンシュタインは、AIの一分野である自然言語処理(NLP)の最新動向を追っていた。ブロンシュタインは、マッコウクジラの「コーダ」と呼ばれる短い発声には、このような分析に適した構造があると確信していた。幸い、グルーバーはシェーン・ゲロという生物学者を知っており、2005年からカリブ海のドミニカ島周辺の海域でマッコウクジラのコーダを大量に記録していた。ブロンシュタインは、これらのデータにいくつかの機械学習アルゴリズムを適用した。「少なくとも比較的簡単な作業では、非常にうまく機能しているように見えました」と彼は言う。しかし、これは単なる概念実証にすぎなかった。より深い分析を行うためには、アルゴリズムにもっと多くの文脈とデータ(数百万の鯨のコーダ)が必要だったのだ。
しかし、動物にはそもそも言葉があるのだろうか?この疑問は、長い間、科学者の間で議論の的となってきた。多くの人にとって、言語は人間の独占欲を満たす最後の砦の一つとなっている。動物行動学の先駆者であるオーストリアの生物学者コンラート・ローレンツは、1949年に出版した『ソロモンの指輪』の中で、自らの動物とのコミュニケーションについて書いている。「動物は本当の意味での言語を持っていない」とローレンツは書いている。
ドイツの海洋生物学者で、動物のコミュニケーションについて複数の著書があるカーステン・ブレンシングは、「私はむしろ、まだ動物の言語について十分に分かっていないと思います」と反論する。ブレンシングは、多くの動物が発する言葉は確かに言語と呼べるものだと確信している。犬は吠えるだけではなく、いくつかの条件があるかもしれないと言う。「まず第一に、言語には意味があります。つまり、ある種の発声には変化しない固定された意味があるということです」。例えば、鳥の一種であるシベリアカケスは、約25の鳴き声の語彙を持っていることが知られているが、その中には一定の意味を持つものもあるのだ。
2つ目の条件は、文を作るためのルールである「文法」だ。長い間、科学者たちは、動物のコミュニケーションには文の構造がないと思っていた。しかし2016年、日本の研究者たちは、シジュウカラの発声に関する研究をネイチャー コミュニケーションズに発表した。特定の状況下では、鳥は捕食者が近づくと、2つの異なる鳴き声を組み合わせてお互いに警告する。研究者がこのシーケンスを聞かせたときも、彼らは反応した。しかし、鳴き声の順序を逆にすると、鳥たちの反応は大きく減少したのだ。ブレンシングは、「これは文法です」と言う。
3つ目の基準は、ある動物種の発声が完全に生得的なものであれば、言語とは呼ばないということだ。ローレンツは、動物は生まれながらにして表現のレパートリーを持っており、一生のうちに多くを学ぶことはないと考えていた。「動物の感情表現は、例えば、ニシコクマルガラスの「キア」や「キアウ」という音のように、人間の話し言葉のようではなく、あくび、眉間にしわを寄せる、微笑むなど、生得的な動作としては、無意識に表現されるものに限られる」と書いている。
いくつかの動物種は、新しい語彙を習得し、方言を発達させ、お互いの名前を識別するなど、声で学習することが証明されている。鳥の中には、携帯電話の着信音を真似するものもいる。イルカはそれぞれの口笛を身につけ、それを名前のように自分を識別するために使っている。
マッコウクジラが海の奥深くに潜り、クリックというシステムを使って長距離のコミュニケーションをとっている。写真:Amanda Cotton/Project CETI
マッコウクジラのクリック音は、その意味を解読するための理想的な候補である。他の種のクジラが発する連続音とは異なり、1と0に変換しやすいという理由だけではない。また、マッコウクジラは最も深い海に潜り、遠く離れた場所でコミュニケーションをとるため、他の動物にとって重要なコミュニケーション手段であるボディランゲージや顔の表情を使うことができない。「クジラのコミュニケーションは主に音響であると考えるのが現実的です」とブロンシュタインは言う。マッコウクジラの脳は動物界で最も大きく、人間の6倍もある。このような動物が2頭で長時間おしゃべりをしていたら、お互いに何か言いたいことがあるのではないかと想像すべきではないだろうか。漁場の情報を教え合っているのだろうか?クジラのお母さんは、人間のように子育ての話をするのだろうか?CETIの研究者たちは、それを探ってみる価値があると言う。
未知の言語を学ぶには、有名な「ロゼッタ・ストーン」のようなものがあれば簡単だ。1799年に発見されたこの石碑には、3つの言語で同じ文章が書かれており、エジプトの象形文字を解読する鍵となった。もちろん、動物界にはそのようなものはない。人間とクジラの辞書も、マッコウクジラの言語の文法規則を記した本もない。
しかし、それを回避する方法がある。明らかに、子供たちはこれらの道具を使わずに、周りで話されている言語を観察するだけで母国語を学んでいる。研究者たちは、この種の学習は基本的に統計的なものであると結論づけている。つまり、毛の生えた動物が部屋に入ってきたときに犬という言葉がよく発せられていることや、ある言葉が他の言葉と関連してよく使われていること、特定の言葉の並びが他の言葉よりも可能性が高いことなどを子供は覚えているのである。この10年間、機械学習の手法は、このような学習を模倣してきた。研究者たちは、巨大なニューラルネットワークに膨大な量の言語データを与えた。そして、それらのネットワークは、言語の内容について何も知らされずに、統計的な観察から言語の構造を見つけることができたのだ。
例えば、OpenAI社が開発した「GPT-3」が有名な言語モデルと呼ばれるものがある。例えばGPT-3は、文頭が与えられると、それを一語一語完成させていく。これは、スマートフォンでテキストメッセージを入力すると候補が表示されるのと似ているが、より洗練されたものになっている。言語モデルは、インターネット上の膨大な量のテキストを統計的に処理することで、どのような単語がよく出現するかを知るだけでなく、文章を構成するためのルールも学習する。言語モデルは、正しい発音の文章を作成するだけでなく、驚くほど質の高い文章を作成することもあるのだ。またこの言語モデルは、与えられたトピックに関するフェイクニュース記事を作成したり、複雑な法律文書を簡単な言葉で要約したり、さらには2つの言語間で翻訳することもできる。
しかし、そのためには膨大な量のデータが必要となる。GPT-3のニューラルネットワークは、約1,750億語のデータを用いてプログラミングされている。一方、シェイン・ゲロが率いる「ドミニカ・マッコウクジラ・プロジェクト」が収集したマッコウクジラのコーダは10万語にも満たないという。そして、マッコウクジラの言語で「単語」が何であるかはまだ分かっていないのだ。
ブロンシュタインのアイデアがうまくいけば、人間の言語モデルに似た、文法的に正しいクジラの発話を生成するシステムを開発することがかなり現実的になる。次のステップは、自由に生きているクジラとの対話を試みるインタラクティブなチャットボットだ。もちろん、クジラがチャットボットを会話の相手として受け入れてくれるかどうかは、今のところ誰にもわからない。ブロンシュタインは、「もしかしたら、クジラが『そんな意味のないことを言うなよ!』と言ってくれるかもしれない」と語る。
人工知能(AI)がマッコウクジラのコミュニケーションを解明する鍵になると研究者たちは期待している。イラスト:Project CETI
しかし、仮にこのアイデアがうまくいったとしても、すべての言語モデルの欠点は、話している言語の内容について何もわからないということだ。研究者たちがクジラと流暢に会話できるボットを作ったとしても、その後、私たちが言葉を理解できなかったら皮肉なものだ。そのため、クジラがどこにいて、誰が誰に話しかけて、どんな反応をしたのか、最初からクジラの行動に関するデータで音声記録に注釈をつけなければならないと考えている。課題は、この何百万ものアノテーションのうち、少なくとも一部を自動化する方法を見つけることなのだ。
また、個々のクジラを記録するためのセンサーや、クジラの位置を監視するための技術など、多くの開発が必要になってくる。個々の音を特定の動物に明確に割り当てるためには、これらの技術が必要なのだ。CETIプロジェクトは、TEDが運営する「Audacious Project」に5年間の資金提供を申請し、資金を得ることができた。このプロジェクトには、ナショナルジオグラフィック協会やマサチューセッツ工科大学(MIT)のコンピュータサイエンス・人工知能研究室など、多くの組織が参加している。
機械学習の技術を動物の言語に応用するというアイデアを思いついたのは、CETIの研究者たちが初めてではない。元物理学者、デザイナー、起業家であり、テクノロジーの評論家に転身したアザ・ラスキンは、2013年にアフリカのゲラダモンキーの複雑な言語について聞いたとき、同様のアイデアを持っていた。人間の言語を処理するために開発されたNLP技術を、動物の発声に応用できないだろうか?そう考えた彼は、Earth Species Projectを立ち上げた。当時、この技術はまだ発展途上であり、言語間の自動翻訳のための自己学習法として実用化されるまでには、それからさらに4年を要した。この単語の埋め込みテクノロジーは、ある言語のすべての単語を多次元の銀河系に見立て、よく一緒に使われる単語同士を近接させ、そのつながりを線で表現する技術だ。例えば、"king"は "man"と関係し、"queen"は "woman"と関係しているように。
その結果、2つの人間の言語の地図を一致させることができることがわかった。現在では、この技術を使って2つの人間の言語間の翻訳を文字で行うことができ、近い将来、文字のない音声記録にも利用できるようになるだろう。
しかし、人間の言語と動物の言語の地図を重ね合わせることは可能なのだろうか?ラスキンは、少なくとも原理的には可能だと確信している。「特に哺乳類には、何らかの共通の経験があるはずです。息をしなければならない、食事をしなければならない、子供が死んだら悲しむ、などです」。同時に、地図が合わない部分もたくさん出てくるだろうとラスキンは考えている。「直接的な翻訳が可能な部分と、人間の経験に直接翻訳できるものがない部分と、どちらがより魅力的になるかはわかりません」。動物が自ら語り、人間がそれに耳を傾けることができるようになれば、「文化が大きく変わる瞬間」を迎えることができるとラスキンは言う。
このマッコウクジラの母子がコミュニケーションをとっているのは間違いないが、研究者たちはお互いに何を話しているのか気になっている。写真提供:Amanda Cotton/Project CETI
確かに、このような期待は、研究を少し先取りしている。科学者の中には、CETIのデータ収集に本当に面白いことがあるのかどうか、非常に懐疑的な人もいる。言語学者であり、『The Language Instinct』という本の著者であるスティーブン・ピンカーは、このプロジェクトをかなり懐疑的に見ている。「私は彼らが何を見つけるのか興味があります」と彼は電子メールに書いている。しかし、マッコウクジラのコーダに豊かな内容と構造を見出すことができるかどうかは、ほとんど期待できないと言っている。「つまり、マッコウクジラのコーダは、自分が誰であるかということだけに意味が限定された特徴的な鳴き声であり、おそらく感情的な鳴き声も一緒に含まれているということです。もしクジラが複雑なメッセージを伝えることができるのであれば、人間に見られるように、なぜそれを使って複雑なことを一緒にすることが見られないのでしょうか?」
ニューヨーク市立大学ハンターカレッジの研究者であるダイアナ・ライスはこれに同意していない。「今、私とあなたを見てみると、私もあなたも大したことをしていないのに、非常に多くの意味のあるコミュニケーションをしています」とビデオインタビューで答えている。それと同じように、クジラがお互いに何を話しているのか、私たちはあまり理解できないと彼女は考えている。「今のところ、私たちは無知の状態にあると言ってもいいでしょう」と彼女は言う。
ライスは長年にわたりイルカの研究を行っており、シンプルな水中キーボードを使ってイルカとコミュニケーションをとっている。彼女は、動物との効果的なコミュニケーション方法を探求するグループ「Interspecies Internet」を共同で設立した。彼女の共同設立者の中には、ミュージシャンのピーター・ガブリエル、インターネットの開発者の一人であるヴィントン・サーフ、MITのCenter for Bits and Atomsのディレクターであるニール・ガーシェンフェルドなどがいる。ライスは、CETIの野心、特にその学際的なアプローチを歓迎している。
クジラのコーダに意味を求めても、面白いものは出てこないかもしれないと考えているCETIの研究者もいる。プログラムリーダーのグルーバーは、「私たちの最大のリスクのひとつは、クジラが信じられないほどつまらないものになるかもしれないということです。しかし、私たちはそのようなことにはならないと考えています。生物学者としての私の経験では、何かをじっくり観察したときに、動物から私たちの考え以上のことが分かったことは一度もないからです」。
CETIプロジェクトの名前は、SETI(地球外知的生命体の探索)を連想させる。SETIは1960年代から宇宙文明の電波信号を求めて空をスキャンしてきたが、これまでのところ1つもメッセージを見つけることができていない。ブロンシュタインは、地球外知的生命体の兆候が見つからない以上、地球上で検出できる信号で解読能力を試すべきだと感じている。宇宙にアンテナを向けるのではなく、海の中の異質な文化に耳を傾けるのだ。「地球上で知的で感覚のある生物はホモサピエンスだけだと考えるのは非常に傲慢だと思います」とブロンシュタインは言う。「もし、私たちの目と鼻の先に動物の文明が存在することを発見したら、もしかしたら環境の扱い方を変えるきっかけになるかもしれません。そして、生きている世界にもっと敬意を払うようになるかもしれません」。