AIにおける新たなブレークスルー! 「咳モデル」が誕生しました。咳はあなたの健康状態を物語ります。

AIにおける新たなブレークスルー! 「咳モデル」が誕生しました。咳はあなたの健康状態を物語ります。

著者 |馬雪偉

序文

世界保健機関(WHO)が2021年に発表したデータによると、世界の死因上位10位による死者は合計3,900万人で、世界全体の死者数(6,800万人)の57%を占めた。これらは主に、心血管疾患(虚血性心疾患、脳卒中など)と呼吸器疾患(結核、慢性閉塞性肺疾患、下気道感染症など)という 2 つの主要な種類の疾患に関連しています。

中でも、呼吸器疾患による咳や呼吸には、私たちの健康状態に関する多くの情報が含まれています。たとえば、臨床医は「喘鳴」のような咳の音を使用して百日咳を診断し、死戦期呼吸を使用して急性心血管イベントを検出します。

では、人工知能(AI)の時代において、この技術を利用して音声データから健康情報を抽出し、身体の状態をより適切に監視できるのでしょうか?

Googleとザンビア感染症研究センター結核部門の研究チームが、この方向で重要な一歩を踏み出しました。両社は共同で、人間の声を監視し、病気の早期兆候に気付くよう設計されたバイオ音響ベースモデルHeAR(Health Acoustic Representations)を立ち上げました。 「HeAR - Health Acoustic Representations」と題された関連研究論文が、プレプリントウェブサイトarXivに掲載されました。

報道によると、彼らは多様で匿名化されたデータセットから慎重に選択された3億の音声データでHeARをトレーニングし、特に約1億の咳の音を使用してこの「咳モデル」をトレーニングしたという。

HeAR は、健康関連の音のパターンを識別でき、幅広いタスクにおいて平均的に他のモデルよりも優れた性能を発揮し、マイクをまたいで一般化することができます。 HeAR を使用してトレーニングされたモデルは、より少ないトレーニング データで高いパフォーマンスを達成しました。これは、データが不足していることが多い医療研究の分野では重要な要素です。 HeAR は現在研究者に提供されており、データ、セットアップ、計算要件を減らしてカスタマイズされた生物音響モデルの開発を加速するのに役立ちます。

HeARのようなソリューションは、AIによる音響分析を結核のスクリーニングと検出に非常に役立つものにし、最も必要としている人々に、影響が少なく簡単にアクセスできるツールを提供するでしょう」と、StopTB Partnershipのデジタルヘルス専門家、Zhi Zhen Qin氏は述べています。

将来的には、研究チームはこの研究を活用して、結核、胸部、肺などの疾患の分野で診断ツールやモニタリングソリューションの開発を進め、世界中のコミュニティの健康状態の改善に貢献したいと考えています。

現在、インドの呼吸器系健康企業サルシット・テクノロジーズは、AIを使って咳の音を分析し、肺の健康状態を評価する「Swaasa」という製品を開発している。同社は、HeAR がバイオ音響 AI モデルの機能を拡張するのにどのように役立つかを模索しています。

咳は病気の兆候となる

HeAR システムは 3 つの主要部分で構成されています。 HeAR システムは、自己教師学習を通じて、大量のラベルなしオーディオ データを活用して、さまざまな健康音響タスクに転送できる一般的なオーディオ表現を学習します。

図|HeARシステム概要

データ収集の段階では、研究チームは健康音響イベント検出器を使用しました。これは、2 秒間のオーディオ クリップ内の 6 つの非音声健康音響イベント (咳、赤ちゃんの咳、呼吸、咳払い、笑い、発話) の存在を識別するためのマルチラベル分類畳み込みニューラル ネットワーク (CNN) です。検出器は、FSD50K および FluSense データセットを使用してトレーニングされ、オーディオ クリップに「咳」、「くしゃみ」、「呼吸」などのラベルが付けられます。

この論文では 2 つのデータセットが使用されています。そのうちの 1 つは、著作権のない公開 YouTube 動画 30 億本から抽出された 2 秒の音声クリップで、合計 3 億 1,330 万クリップ、つまり約 174,000 時間の音声になります。これらのセグメントは、Healthy Acoustic Event Detector を使用してスクリーニングされました。もう1つはザンビア伝染病研究センターが収集したもので、結核の疑いのある患者599人の咳の音声録音と胸部X線写真が含まれていた。

研究チームは、2秒間の音声クリップ3億1,300万個からなる大規模なデータセットでトレーニングされたマスク付きオートエンコーダを使用しました。線形プローブにより、HeAR は 6 つのデータセットにわたる 33 の健全な音響タスクのベンチマークで、すべての健全なオーディオ埋め込みモデルの中で SOTA パフォーマンスを達成しました。

図 | HeAR は、33 の健康オーディオ タスクで最高の平均ランキング (MRR = 0.708) を達成し、他のすべてのベースライン モデルを上回りました。

HeAR は、FSD50K および FluSense データセットで他のモデルよりも優れており、特に FSD50K でトレーニングされたモデルの中で 2 位にランクされています。

図|FSD50K および FluSense データセットにおける健康音響イベント検出タスクのパフォーマンス比較。

HeAR は、人口統計、ライフスタイルを含む 14 の咳推論タスクのうち 10 でベースライン モデルを上回ります。 TB および CXR タスクでは、そのパフォーマンスは最高のモデルに匹敵します。

図|咳推論タスクの性能比較。

HeAR は、SpiroSmart データセットの 4/5 肺機能テストタスクと性別分類タスクでベースライン モデルを上回ります。

図|肺機能検査課題の成績比較。

CIDRZ データセットでの HeAR のパフォーマンスは、さまざまな記録デバイスの影響を受けず、さまざまなデバイスに対して堅牢です。さらに、HeAR はトレーニング データが少ない場合でも優れたパフォーマンスを実現できるため、ラベル付きデータが不足している医療研究においてさらに有利になります。

ただし、HeAR にも一定の制限があります。たとえば、線形プローブではモデルのパフォーマンスの可能性を十分に引き出すことができず、一部のデータ セットは規模が小さくクラスの不均衡の問題があり、HeAR などのモデルは大きく、携帯電話などのデバイスで実行するのが困難です。

研究チームは、今後はモデルの微調整や機能の追加によるパフォーマンス向上のほか、より多くのデータの収集やデータ前処理方法の改善も検討する可能性があると述べた。また、モデルをローカルデバイスで実行できるようにするために、モデルの圧縮と量子化の技術を研究することも検討できます。

AI支援による病気診断には大きな可能性がある

医師の補助から病気の単独診断まで、AIは医療分野でますます活用され、大きな可能性を示しています。

今年6月、インペリアル・カレッジ・ロンドンとケンブリッジ大学の研究チームは、AIモデルEMethylNETを訓練し、DNAメチル化パターンを観察することで、非がん組織から13種類のがん(乳がん、肝臓がん、肺がん、前立腺がんなど)を識別し、その精度は最大98.2%に達した。

7月には、ボストン大学の研究チームとその協力者らが開発したAIツールが、10種類の認知症を(同時に)診断するのに役立ち、神経科医の診断精度が26%以上向上すると期待されている。

最近、AIは、子供たちの「目に見えない殺人者」である自閉症をターゲットにした画期的な進歩も遂げています。カロリンスカ研究所の研究チームが開発したマルチモーダルデータ分析AIモデルは、生後12か月前後の子供の自閉症の初期兆候を検出できるだけでなく、2歳未満の子供を識別する精度も80.5%です。さらに重要なのは、プロセス全体では比較的限られた情報しか必要としないことです。

近い将来、AI が人間によるより多くの病気の診断に役立ち、医療健康分野にさらなる可能性をもたらすことが予測されます。

<<:  北京と天津の人々が感染しました!この虫を見つけたら、叩かないでください。

>>:  砂漠でカニを養殖できますか?はい、あなたのテーブルにやって来ます!

推薦する

それをしなければ、死ぬことはない。国美は自らの弱点を利用して他者の強みと戦うという茶番劇を演じた。

工業情報化部は8月12日、「第3回中国家電オンラインショッピングサミットフォーラム」において、「20...

鶏が食卓に届くまでにどのような過程を経るのでしょうか?観終わったらチキンドラムスティックを食べよう!

左手に鶏のドラムスティック、右手に手羽先を持って楽しんでいるとき、このおいしいフライドチキンのドラム...

「ホットで美しい」がまとめて配送されますか? 「石炭火力発電」の送電から「グリーン電力」の供給への転換

編集者注:数百万のIPが科学技術を創造し、科学技術強国の夢を共同で構築します。科学知識を普及し、科学...

2022年6月号「サイエンス」噂リスト:水痘は子供だけが罹る?今年の夏は寒いでしょうか?

北京科学技術新メディア協会です月刊「科学」噂リスト2022年6月の「サイエンス」噂リストが発表されま...

アメリカ人参の食べ方

現代人は仕事が忙しく、運動不足で、長時間屋内に閉じこもっているため、体力が弱り、抵抗力や免疫力が低下...

高麗宮、なぜ素晴らしいのですか?

↑極限の世界の探検に焦点を当てたナショナルジオグラフィックファンのグループグローバル表面の大部分す...

サポジラ?怖いようですが、食べてみる勇気はありますか?

サポジラという名前はちょっと怖い感じがしますが、ちょっと不思議でもあります。 「人の心」に関係する果...

超音速飛行における新たな進歩! 「雲金都」は航空の新時代を切り開くか?

著者: 李伝福史祥綺2024年12月17日、四川凌空天星科技有限公司が開発した高速ラムジェットエンジ...

色とりどりのニンジン、とげとげしたキュウリ、白い果肉のスイカ…これらの作物は、おいしくなるために多大な費用がかかっています。

ずっと昔にニンジンには様々な色があるキュウリは鋭いトゲと大きな芯、そして苦い果肉を持っています。スイ...

PK知的財産:MeizuとOPPO、どちらが強いのか?

ラバか馬かは、散歩に連れて行ってみないとわかりません。国産携帯電話の中でも侮れない勢力がある。当面は...

雪貝は胸を大きくするのでしょうか?

雪貝は胸を大きくするのでしょうか?これは多くの女性が懸念しているテーマだと思います。現実世界では、小...

卵子は生まれ変わることができるのでしょうか?交通の時代に、本当の科学を正しく開くにはどうすればいいのでしょうか?

水猿を特定した生物学ブロガー「Huzhang」、大規模な法律教育シリーズ「無法者張三の生涯」の作者で...

Tuan800: 2011 年中国グループ購入業界統計レポート

2011年は成功裏に終わりました。 Tuan800データ レポート チームは、この機会を利用して、業...

蘇州リスマンダリンフィッシュ

蘇州リスマンダリンフィッシュは非常に有名な珍味です。この料理の調理と材料の組み合わせにはいくつかの方...