21歳の大学生が2000年前の古代の巻物の謎を解明:AIを使って「失われた」文書を再現

21歳の大学生が2000年前の古代の巻物の謎を解明:AIを使って「失われた」文書を再現

2000年以上前に「消失」した古代の巻物が、AIによって再現された。

最近、21歳のコンピューターサイエンスの学生が人工知能(AI)技術を使用して、未開封のヘルクラネウムの巻物の最初の単語を発見しました。

ネブラスカ大学リンカーン校のルーク・ファリター氏は、巻かれたパピルスに書かれた「紫」を意味するπορphiυρας(ポルフィラス)などのギリシャ文字を検出できる機械学習アルゴリズムを開発した。

表面の質感の微妙で小さな違いを利用してニューラル ネットワークをトレーニングし、インクを強調表示することで、ルーク氏は 4 平方センチメートルの範囲内で 10 文字以上を解読して読み取ることに成功し、賞金 4 万ドルの First Letters 大賞を獲得しました。

フィギュア|ルーク・ファリターの初投稿

「最初の画像を見たとき、巻物の内部から実際に何かが見えたことに衝撃を受けました」と、イタリアのナポリ大学のパピルス学者で、ファリター氏の研究を審査した学術委員会のメンバーであるフェデリカ・ニコラルディ氏は言う。

ヘルクラネウム文書はポンペイ近郊の私設図書館に収蔵されていた古代の巻物で、西暦 79 年のベスビオ山の噴火により埋もれ炭化しました。ほぼ 2,000 年の間、この唯一現存する古代の図書館は 20 メートルの火山泥の下に埋もれていました。これらは 18 世紀に発掘されたもので、ある程度は保存されているものの、非常に壊れやすく、適切に取り扱わなければ粉々になってしまいます

開けられない巻物をどうやって読むのか?何百年もの間、この疑問は未だに答えられていない。

2019年、ケンタッキー大学EduceLabのブレント・シールズ教授は、粒子加速器でヘルクラネウム文書を撮影し、最大4µmの解像度の3D CTスキャンを生成しました。彼のチームはまた、インクが見える状態で切り離された巻物の断片をスキャンして写真を撮り、真実のデータセットを提供した。シールズ教授の大学院生スティーブン・パーソンズ氏は、機械学習モデルを使用してCTスキャンからインクを検出する研究を行い、破片を分離することに成功した。

この成功はテクノロジー起業家のナット・フリードマン氏とダニエル・グロス氏の注目を集め、彼らは進歩を加速させるためにベスビオ・チャレンジを立ち上げました。彼らは2023年3月に公開コンテストを開始し、70万ドルの優勝賞金に加えて、オープンソースのツールやテクノロジーの開発に対していくつかの小規模な賞金も提供しました。

その後、少人数の研究者グループが、もともと EduceLab によって構築され、コミュニティによって改良されたツールを使用して、巻物の 3D 構造をマッピングし始めました。今年7月までに、巻物の数百平方センチメートルが分割され、「ほぼ平らになった」。

8月初旬、元JPLスタートアップ創業者のケーシー・ハンドマー氏は、インクのように見える「亀裂パターン」を発見したことについてブログ記事を書いた。ケイシーさんは、2000年ぶりに未開封の巻物の中にインクと手紙を発見した人物だ。

図 |インクの位置を示す注釈(出典:Casey のブログ投稿)

大学生でSpaceXの夏季インターンシップ生のルーク・ファリターさんは、ドワルケシュ・パテルさんとナットさんのポッドキャストインタビューでベスビオ・チャレンジについて知りました。

ケイシーで見た亀裂のパターンはDiscordで議論され、彼は夜遅くにその亀裂のパターンに基づいて機械学習モデルのトレーニングを開始した。新しい亀裂が発見されるたびにモデルが改良され、リール上にさらに多くの亀裂を表示できるようになります。

ルークは、ラベルを付けてトレーニング データとして使用できる数十のインク ストロークといくつかの完全な文字を見つけました。その後すぐに、巻物には肉眼では見えないひび割れの兆候が現れ始めました。やがて、その痕跡は文字や実際の単語のヒントを形成し始めました。

一方、もう一人の競争者であるベルリンのバイオロボット工学大学院生、エジプト人のユセフ・ナダールさんは、異なるアプローチをとった。ケイシーとルークの発見に触発され、彼は Kaggle のインク検出賞の受賞作品を精査しました。この賞は、断片を分離するスティーブン・パーソンズの機械学習アプローチの改善に焦点を当てたものでした。彼は、ドメイン転送技術、つまりスクロール データに対する教師なし事前トレーニングと、クリップ ラベルの微調整を使用して、これらのモデルをスクロールに適応させました。

彼は「インク検出フォローアップ賞」にアイデアを提出し、小さな賞金を獲得しました。数週間後、ユセフは作品をファースト・レター賞に応募した。彼は、ルーク氏が Twitter と Discord で共有した初期の結果を見て、スクロール内の同じ領域に焦点を当てることにしました。

図|ユセフ・ナデルの最終提出

ケイシー氏は亀裂を見つけるための手動の方法にはまったく頼っていなかったものの、Kaggle コンテストからの修正モデルを使用していくつかの文字を見つけることに成功しました。次に、ラベルデータに文字の形のようなものを注釈付けしました。

セグメンテーション チームと参加者は進歩を続けており、数日前に Youssef のモデルは驚くほど鮮明で大きな新しい画像を作成しました (下図参照)。

ベニスのカ・フォスカリ大学の古代ギリシャ・ローマ史学者、テア・ゾンマーシールド氏はネイチャー誌に対し、この発見は「古代史と文学に対する私たちの理解に革命をもたらす可能性がある」と説明した。

参考リンク:

https://www.nature.com/articles/d41586-023-03212-1

https://scrollprize.org/firstletters

https://people.com/21-year-old-wins-usd40k-after-using-ai-to-read-first-word-on-2-000-year-old-papyrus-scroll-8358107

著者: ヤン・イーミ

編集者: 学術

<<:  [世界脊椎デー] 腰痛、腰痛緩和エクササイズが役立つ

>>:  「宇宙葬」は本当に可能なのか?

麺
ブログ    

推薦する

キクイモの作り方

キクイモの調理方法はたくさんあります。まずはキクイモとは何かを理解することから始めましょう。キクイモ...

食通はすべての侵入種を食べることができるのでしょうか?食通の能力を過大評価しない

湖全体を干拓しても捕獲されるアリゲーターガーから、当局が市民に目撃したら報告するよう呼びかけているカ...

武昌魚を食べるとどんな効能がありますか?

武昌魚は皆さんもよくご存知だと思います。毛沢東主席の著書の中で、武昌魚は非常に美味しい魚であると書か...

フランスは自動車産業の発展ロードマップを発表し、今後4年間で電気自動車、ハイブリッド車、自動運転車の開発を優先する。

最近、フランス経済省、環境省、運輸省、およびフランスの大手自動車企業は、国際的な自動車分野における大...

ナマコの浸漬

条件が整えば、誰もが新鮮な食材を食べたいはずです。より手軽に食べられるようにするために、乾物が誕生し...

さあ行こう!火星へ向かって

さまざまな深宇宙探査の中でも、科学者や天文学者は地球の「最も近い隣人」である火星の探査に特別な関心を...

搾りたてのサトウキビジュース

搾りたてのサトウキビジュースは、よく街で飲めるフルーツドリンクの一種です。しかし、ほとんどの人は、搾...

ネギと豚肉の餃子の作り方

餃子は私たちのお気に入りのおやつの一つです。餃子は水餃子とも呼ばれます。中国では、旧正月に餃子を食べ...

宇宙マイクロ波背景放射とは何ですか?それはビッグバンの後に作られたのでしょうか?

宇宙マイクロ波背景放射とは何ですか?宇宙マイクロ波背景放射の創造と発見宇宙マイクロ波背景放射(略して...

ベーコンとエンドウ豆のもち米

名前の通り、もち米はもち米から作られた米です。もち米は、個人のニーズに応じてさまざまな材料と組み合わ...

セロリとカシューナッツのエビのレシピ

現在、人々の思想の進歩と調理技術の向上により、人々の食習慣はますます多様化しています。例えば、今レス...

牡蠣の蒸し方

牡蠣といえば、あまり馴染みのない方も多いと思います。牡蠣は比較的一般的な二枚貝で、主に温帯や熱帯の海...

自家製エビペーストの作り方

エビペーストは、魚介類を食べるのが好きな人にとっては非常に馴染み深いものです。では、自分でエビペース...

ライフシーン記録 |なぜ事故はいつもトイレで起こるのでしょうか?

自宅のバスルームは緊急事態が頻繁に発生する場所ですが、私たちが見落としがちな場所でもあります。心臓血...

あなたが食べているミントは本物のミントではないのですか?

レビュー専門家: Shen Tingting 博士植物学私は飲み物好きとして、さまざまな特別なドリン...