21歳の大学生が2000年前の古代の巻物の謎を解明:AIを使って「失われた」文書を再現

21歳の大学生が2000年前の古代の巻物の謎を解明:AIを使って「失われた」文書を再現

2000年以上前に「消失」した古代の巻物が、AIによって再現された。

最近、21歳のコンピューターサイエンスの学生が人工知能(AI)技術を使用して、未開封のヘルクラネウムの巻物の最初の単語を発見しました。

ネブラスカ大学リンカーン校のルーク・ファリター氏は、巻かれたパピルスに書かれた「紫」を意味するπορphiυρας(ポルフィラス)などのギリシャ文字を検出できる機械学習アルゴリズムを開発した。

表面の質感の微妙で小さな違いを利用してニューラル ネットワークをトレーニングし、インクを強調表示することで、ルーク氏は 4 平方センチメートルの範囲内で 10 文字以上を解読して読み取ることに成功し、賞金 4 万ドルの First Letters 大賞を獲得しました。

フィギュア|ルーク・ファリターの初投稿

「最初の画像を見たとき、巻物の内部から実際に何かが見えたことに衝撃を受けました」と、イタリアのナポリ大学のパピルス学者で、ファリター氏の研究を審査した学術委員会のメンバーであるフェデリカ・ニコラルディ氏は言う。

ヘルクラネウム文書はポンペイ近郊の私設図書館に収蔵されていた古代の巻物で、西暦 79 年のベスビオ山の噴火により埋もれ炭化しました。ほぼ 2,000 年の間、この唯一現存する古代の図書館は 20 メートルの火山泥の下に埋もれていました。これらは 18 世紀に発掘されたもので、ある程度は保存されているものの、非常に壊れやすく、適切に取り扱わなければ粉々になってしまいます

開けられない巻物をどうやって読むのか?何百年もの間、この疑問は未だに答えられていない。

2019年、ケンタッキー大学EduceLabのブレント・シールズ教授は、粒子加速器でヘルクラネウム文書を撮影し、最大4µmの解像度の3D CTスキャンを生成しました。彼のチームはまた、インクが見える状態で切り離された巻物の断片をスキャンして写真を撮り、真実のデータセットを提供した。シールズ教授の大学院生スティーブン・パーソンズ氏は、機械学習モデルを使用してCTスキャンからインクを検出する研究を行い、破片を分離することに成功した。

この成功はテクノロジー起業家のナット・フリードマン氏とダニエル・グロス氏の注目を集め、彼らは進歩を加速させるためにベスビオ・チャレンジを立ち上げました。彼らは2023年3月に公開コンテストを開始し、70万ドルの優勝賞金に加えて、オープンソースのツールやテクノロジーの開発に対していくつかの小規模な賞金も提供しました。

その後、少人数の研究者グループが、もともと EduceLab によって構築され、コミュニティによって改良されたツールを使用して、巻物の 3D 構造をマッピングし始めました。今年7月までに、巻物の数百平方センチメートルが分割され、「ほぼ平らになった」。

8月初旬、元JPLスタートアップ創業者のケーシー・ハンドマー氏は、インクのように見える「亀裂パターン」を発見したことについてブログ記事を書いた。ケイシーさんは、2000年ぶりに未開封の巻物の中にインクと手紙を発見した人物だ。

図 |インクの位置を示す注釈(出典:Casey のブログ投稿)

大学生でSpaceXの夏季インターンシップ生のルーク・ファリターさんは、ドワルケシュ・パテルさんとナットさんのポッドキャストインタビューでベスビオ・チャレンジについて知りました。

ケイシーで見た亀裂のパターンはDiscordで議論され、彼は夜遅くにその亀裂のパターンに基づいて機械学習モデルのトレーニングを開始した。新しい亀裂が発見されるたびにモデルが改良され、リール上にさらに多くの亀裂を表示できるようになります。

ルークは、ラベルを付けてトレーニング データとして使用できる数十のインク ストロークといくつかの完全な文字を見つけました。その後すぐに、巻物には肉眼では見えないひび割れの兆候が現れ始めました。やがて、その痕跡は文字や実際の単語のヒントを形成し始めました。

一方、もう一人の競争者であるベルリンのバイオロボット工学大学院生、エジプト人のユセフ・ナダールさんは、異なるアプローチをとった。ケイシーとルークの発見に触発され、彼は Kaggle のインク検出賞の受賞作品を精査しました。この賞は、断片を分離するスティーブン・パーソンズの機械学習アプローチの改善に焦点を当てたものでした。彼は、ドメイン転送技術、つまりスクロール データに対する教師なし事前トレーニングと、クリップ ラベルの微調整を使用して、これらのモデルをスクロールに適応させました。

彼は「インク検出フォローアップ賞」にアイデアを提出し、小さな賞金を獲得しました。数週間後、ユセフは作品をファースト・レター賞に応募した。彼は、ルーク氏が Twitter と Discord で共有した初期の結果を見て、スクロール内の同じ領域に焦点を当てることにしました。

図|ユセフ・ナデルの最終提出

ケイシー氏は亀裂を見つけるための手動の方法にはまったく頼っていなかったものの、Kaggle コンテストからの修正モデルを使用していくつかの文字を見つけることに成功しました。次に、ラベルデータに文字の形のようなものを注釈付けしました。

セグメンテーション チームと参加者は進歩を続けており、数日前に Youssef のモデルは驚くほど鮮明で大きな新しい画像を作成しました (下図参照)。

ベニスのカ・フォスカリ大学の古代ギリシャ・ローマ史学者、テア・ゾンマーシールド氏はネイチャー誌に対し、この発見は「古代史と文学に対する私たちの理解に革命をもたらす可能性がある」と説明した。

参考リンク:

https://www.nature.com/articles/d41586-023-03212-1

https://scrollprize.org/firstletters

https://people.com/21-year-old-wins-usd40k-after-using-ai-to-read-first-word-on-2-000-year-old-papyrus-scroll-8358107

著者: ヤン・イーミ

編集者: 学術

<<:  [世界脊椎デー] 腰痛、腰痛緩和エクササイズが役立つ

>>:  「宇宙葬」は本当に可能なのか?

推薦する

美団は7年間にわたり、あらゆる方向に拡大を続けてきました。王星の境界は明らかになったか?

3週間前、美団が30億ドルの資金を調達したというニュースが報じられた。これは今年に入ってから美団に...

レノボのスマートグラスは生態学的活力のない「イメージプロジェクト」

スマートハードウェアの分野では、常に時々大きな動きがあります。多くのメーカーがスマートウォッチやスマ...

『永遠の月』に出てくる桑酒はどんな貝ですか?

最近、ファンタジードラマ「張悦金明」がYoukuで放映され、予想外に珍味であるあさり春雨の人気を博し...

酢豚の作り方

私の友達の多くは酢豚を食べたことがあると思います。酢豚の調理方法はたくさんありますが、この記事では主...

PinduoduoとJitu Expressの刺激により、アリババは「Cainiao Express」を立ち上げ、3つのリンクと1つの成果は敗者となった

最近、2023年グローバルスマート物流サミットにおいて、アリババのCainiao Networkは独...

朝食レシピ紹介

朝食は私たちの生活の重要な部分です。朝に昼食を食べないと、体は朝に十分なエネルギーを供給することがで...

前十字靭帯損傷時に食べるもの

ダイエットに関して言えば、単にお腹を満たすだけではなく、健康を維持したり、病気のときに回復したりする...

ワンタンの皮の作り方

ワンタンは、特に南部では誰もが知っている食べ物です。私たちはみんなワンタンが大好きです。ワンタンの作...

「2019年中国自動車製品品質性能調査」は、国内主流自動車製品の全体的な品質性能と動向を深く分析しています。

消費者の悩みを解決し、OEMが品質問題を発見して改善し、中国の自動車産業における製品品質の向上を支援...

賞味期限切れの牛乳の魔法の活用法

牛乳は栄養価が高いだけでなく、人々の健康にも有益です。しかし、不注意で家庭に保存した牛乳が賞味期限切...

FIS: 2021年グローバル決済レポート

FIS は、2021 年のグローバル決済レポートを発表しました。主な洞察は次のとおりです。電子商取引...

トマト卵スープ

トマト卵スープは多くの人に好まれています。この種類のスープは栄養が豊富で、食欲を刺激するのに非常に優...

自分自身の父親を作ろう: Google が再び世界を変えた方法

巨大企業グーグルが再編する。 8月10日、GoogleはAlphabetというブランド名でデビューし...

アメリカ人参を使ったチキンスープの作り方

アメリカニンジンは日常生活において比較的栄養価の高い薬用食品です。通常、煮込み用のスープに入れられま...

ボルボ XC40 を見た後でも、Q3 を購入しますか?もうティグアンを買いたくない。

国産高級ブランドのコンパクトSUVの中で、アウディQ3は価格面での優位性により、常にメルセデス・ベン...