2013 年の夏、Google のオープンソース ブログに「言葉の背後にある意味を学ぶ」というタイトルの何の変哲もない投稿が掲載されました。 「コンピューターは今のところ人間の言語を理解するのがあまり得意ではなく、その目標にはまだ程遠いが、最新の機械学習と自然言語処理技術を使って大きな進歩を遂げている」と投稿には書かれている。 Google は、印刷メディアとインターネットから、これまでの最大のデータセットの数千倍にあたる膨大な量の人間の言語データを取得し、それを生物学にヒントを得た「ニューラル ネットワーク」に入力して、システムに単語間の相関関係とつながりを探させました。 いわゆる「教師なし学習」を利用して、システムはパターンを発見し始めました。たとえば、単語の意味に関係なく、「北京」という単語は「中国」と「モスクワ」と同じ関係にあると指摘しています。コンピューターは「理解している」と言えますか?それは哲学者だけが答えられる質問ですが、システムが「読んでいる」ものの本質をある程度捉えていることは明らかです。 Google はこのシステムを「word2vec」(単語からデジタルベクトルへの変換)と名付け、オープンソース化した。数学者にとって、ベクトルはさまざまな素晴らしい特性を持っています。単純な数字のように、加算、減算、乗算などの操作を行うことができます。このようにして、研究者たちはすぐに驚くほど予想外のことを発見しました。彼らはそれを「連続空間の語彙表現における言語的規則性」と呼んでいますが、それを説明するのは思ったほど難しくありません。 Word2vec は単語をベクトルに変換し、数学演算を実行できるようにします。 たとえば、「中国」+「川」と入力すると、揚子江が表示されます。 「Paris-France+Italy」と入力すると、「Rome」が表示されます。 キング男性+女性を入力すると、女王が生まれます。 結果は驚くべきものでした。 word2vecシステムはGoogleの機械翻訳や検索エンジンに使われるようになり、業界では採用などの他の分野でも広く使われるようになりました。これは、科学や工学の分野でデータ駆動型の言語学者を目指す新世代にとって欠かせないツールとなっています。 2年が経過しましたが、誰も問題があることに気づきませんでした。 機械学習には主に 3 つの領域が含まれます。教師なし学習では、機械に word2vec システムなどの大量のデータが直接与えられ、そのデータを理解し、パターンや規則性、データを改良、表現、視覚化するための有用な方法を見つけることが目標となります。教師あり学習では、仮釈放者が再犯するかどうかなど、分類またはラベル付けされた一連の例をシステムに与えて学習させ、学習したモデルを使用して、これまで見たことのない、または基本的な事実がまだ明らかでない新しい例について予測を行います。強化学習では、エネルギーと危険が共存するボート競技場のように、報酬と罰のある環境にシステムを配置し、罰を最小限に抑え、報酬を最大化する最善の方法を見つけることを目標とします。 世界が機械学習の分野が提供する数学的モデルや計算モデルにさまざまな形で徐々に依存するようになっていることに気づく人が増えています。これらの単純で複雑なモデル (一部は単なるスプレッドシート、その他は AI と呼べる) は、徐々に人間の判断や、より伝統的な明示的にプログラムされたプログラムに取って代わりつつあります。 これはテクノロジーやビジネスの分野だけでなく、倫理的、道徳的な意味合いを持つ分野でも起こります。司法制度では保釈や仮釈放の決定を下す際に「リスク評価」ソフトウェアをますます利用し始めている。道路を走る車両はますます自動運転化しています。ローンの申し込み、履歴書、健康診断などは、人間によって評価されなくなってきています。 21 世紀に入り、比喩的にも文字通りにも世界を自律的に動かすために働く人々がますます増えています。 近年、2つの異なるグループが警鐘を鳴らしている。最初のグループは、現在の技術的倫理的リスクに焦点を当てています。顔認識システムが特定の民族グループや性別に対して特に不正確であったり、裁判官、弁護士、被告人を含む法廷内の誰も理解していない監査されていない統計モデルに基づいて誰かが保釈なしの判決を受けたりする場合、それは問題となる。このような疑問は、伝統的な学問分野内で解決することはできず、コンピューター科学者、社会学者、弁護士、政策専門家、倫理学者の間の対話を通じてのみ解決できます。会話が始まりました。 別のグループは将来の危険を懸念している。私たちのシステムが柔軟かつリアルタイムの意思決定を行えるようになるにつれて、この危険は仮想世界と現実世界の両方に存在します。間違いなく、過去 10 年間は歴史上最も刺激的でありながらも、突然で憂慮すべき AI と機械学習の進歩が見られました。同時に、目に見えないタブーが徐々に破られ、AI研究者は安全性の問題について議論することをためらわなくなっています。実際、過去 5 年間で、この懸念はこの分野では周辺的なものから主流のものへと移行しました。 短期的な問題と長期的な問題のどちらを優先すべきかについては議論があるものの、両グループは大きな目標については合意している。機械学習システムがより一般的かつ強力になるにつれ、私たちは魔法使いと弟子のような状況に陥ることがますます増えるでしょう。つまり、私たちは力を召喚し、それに一連の指示を与え、それが自律的でありながら完全に従順であることを期待します。そして、その指示が不正確または不完全であることに気づいたら、私たちの知恵を使って恐ろしいものを召喚しないように、急いでそれを阻止します。 このような壊滅的な相違をいかに防ぐか、つまり、これらのモデルが私たちの規範や価値観を捉え、私たちの意味や意図を理解し、そして最も重要なことに、私たちが望むように動作することを確実にする方法は、コンピューター サイエンスにおける最も中心的かつ差し迫った問題の 1 つになっています。この問題はアライメント問題と呼ばれます。 研究の最前線がいわゆる「汎用」知能の開発にますます近づき、現実世界の機械学習システムが個人および大衆生活の道徳的、倫理的領域にますます侵入するにつれて、この警告に対して突然活発な反応が起こっています。多様なグループが伝統的な学問分野の境界を越えています。非営利団体、シンクタンク、研究機関などが積極的に参加しています。ますます多くの業界リーダーや学術界リーダーが声を上げ、それに応じて研究資金を増やしています。機械学習の倫理と安全性を専門とする第一世代の大学院生が入学しました。アライメント問題への最初の対応者が現場に到着しました。 機械学習は表面的には技術的な問題ですが、ますます人間の問題が絡んできます。 人間的、社会的、公共的な問題は技術的なものになりつつあります。技術的な課題は、人間的、社会的、公的なものになりつつあります。これらのシステムを「私たちが望むように動作させる」ことにおける私たちの成功と失敗は、私たちが自分自身を分析するための現実的で啓発的な鏡となることが判明しました。 良くも悪くも、次の世紀の人類の物語は、多種多様なインテリジェント システムの構築と導入の物語となる可能性が高い。魔法使いの弟子のように、私たちはほうきで満たされた世界に住む多くのエージェントの 1 人であることに気づくかもしれません。 具体的にどのように教えればよいのでしょうか?何を教えるか? |
<<: 記録を破ろう! 16MWの洋上風力タービンが独自の技術で「風を宝物に変える」
>>: 月面着陸と太陽探査に成功したインドの深宇宙探査はどのように発展しているのでしょうか?
Intel の 100 シリーズ マザーボード チップセットの完全なリリースは、PC 業界が新たな一...
米酢に浸した卵、初めてこの言葉を聞いた人は驚くでしょう。米酢は卵を浸すのに使えます。確かに驚きですが...
ネイチャートランペットコラム第17号へようこそ。過去半月の間に、私たちは次のような興味深い自然に関す...
2017年10月13日、「中国海外旅行発展年次報告書2017」が北京で発表されました。当研究所国際問...
人間の体は、恐怖を感じたり、脅威を感じたり、激しい運動をしたりすると、しばしば「驚くべき能力」を発揮...
大豆製品の健康効果は誰もがよく知っていますが、発酵するとその健康効果が変わることをご存知ですか?最近...
ニシンは一般的な海水魚です。油分が多く、骨が多いですが、味は美味しいです。調理方法はたくさんあります...
人間は肉食動物なので、食べられる肉であれば、美味しいかどうかよく味見をします。ウサギは古くからこの世...
「塩」は五味の第一であると言われています。 「塩」がなければ、多くの料理は味気ないものになります。...
燕の巣は誰もが知っていると思います。燕の巣は非常に貴重な食品です。燕の巣を定期的に食べると、体の免疫...
紫芋は、私たちが日常生活でよく食べる食べ物です。どんな食べ物であっても、私たちには独自の食べ方があり...
涼皮は小麦粉と澱粉で作られており、冷たい食べ物なので夏に食べるのに適しています。小麦粉を使った食べ物...
草を這う虫は、科学的にはダニ(pí)として知られており、多くの人にとって馴染みのあるものとそうでない...
「咳!咳!咳!」 「小王さん、最近どうしたんですか?どうして咳が止まらないんですか?」 「仕方ないで...
「中国ペット産業白書2023-2024」によると、中国では現在ペットを飼っている世帯が1億を超えて...