著者 |馬雪偉 序文 世界保健機関(WHO)が2021年に発表したデータによると、世界の死因上位10位による死者は合計3,900万人で、世界全体の死者数(6,800万人)の57%を占めた。これらは主に、心血管疾患(虚血性心疾患、脳卒中など)と呼吸器疾患(結核、慢性閉塞性肺疾患、下気道感染症など)という 2 つの主要な種類の疾患に関連しています。 中でも、呼吸器疾患による咳や呼吸には、私たちの健康状態に関する多くの情報が含まれています。たとえば、臨床医は「喘鳴」のような咳の音を使用して百日咳を診断し、死戦期呼吸を使用して急性心血管イベントを検出します。 では、人工知能(AI)の時代において、この技術を利用して音声データから健康情報を抽出し、身体の状態をより適切に監視できるのでしょうか? Googleとザンビア感染症研究センター結核部門の研究チームが、この方向で重要な一歩を踏み出しました。両社は共同で、人間の声を監視し、病気の早期兆候に気付くよう設計されたバイオ音響ベースモデルHeAR(Health Acoustic Representations)を立ち上げました。 「HeAR - Health Acoustic Representations」と題された関連研究論文が、プレプリントウェブサイトarXivに掲載されました。 報道によると、彼らは多様で匿名化されたデータセットから慎重に選択された3億の音声データでHeARをトレーニングし、特に約1億の咳の音を使用してこの「咳モデル」をトレーニングしたという。 HeAR は、健康関連の音のパターンを識別でき、幅広いタスクにおいて平均的に他のモデルよりも優れた性能を発揮し、マイクをまたいで一般化することができます。 HeAR を使用してトレーニングされたモデルは、より少ないトレーニング データで高いパフォーマンスを達成しました。これは、データが不足していることが多い医療研究の分野では重要な要素です。 HeAR は現在研究者に提供されており、データ、セットアップ、計算要件を減らしてカスタマイズされた生物音響モデルの開発を加速するのに役立ちます。 「 HeARのようなソリューションは、AIによる音響分析を結核のスクリーニングと検出に非常に役立つものにし、最も必要としている人々に、影響が少なく簡単にアクセスできるツールを提供するでしょう」と、StopTB Partnershipのデジタルヘルス専門家、Zhi Zhen Qin氏は述べています。 将来的には、研究チームはこの研究を活用して、結核、胸部、肺などの疾患の分野で診断ツールやモニタリングソリューションの開発を進め、世界中のコミュニティの健康状態の改善に貢献したいと考えています。 現在、インドの呼吸器系健康企業サルシット・テクノロジーズは、AIを使って咳の音を分析し、肺の健康状態を評価する「Swaasa」という製品を開発している。同社は、HeAR がバイオ音響 AI モデルの機能を拡張するのにどのように役立つかを模索しています。 咳は病気の兆候となる HeAR システムは 3 つの主要部分で構成されています。 HeAR システムは、自己教師学習を通じて、大量のラベルなしオーディオ データを活用して、さまざまな健康音響タスクに転送できる一般的なオーディオ表現を学習します。 図|HeARシステム概要 データ収集の段階では、研究チームは健康音響イベント検出器を使用しました。これは、2 秒間のオーディオ クリップ内の 6 つの非音声健康音響イベント (咳、赤ちゃんの咳、呼吸、咳払い、笑い、発話) の存在を識別するためのマルチラベル分類畳み込みニューラル ネットワーク (CNN) です。検出器は、FSD50K および FluSense データセットを使用してトレーニングされ、オーディオ クリップに「咳」、「くしゃみ」、「呼吸」などのラベルが付けられます。 この論文では 2 つのデータセットが使用されています。そのうちの 1 つは、著作権のない公開 YouTube 動画 30 億本から抽出された 2 秒の音声クリップで、合計 3 億 1,330 万クリップ、つまり約 174,000 時間の音声になります。これらのセグメントは、Healthy Acoustic Event Detector を使用してスクリーニングされました。もう1つはザンビア伝染病研究センターが収集したもので、結核の疑いのある患者599人の咳の音声録音と胸部X線写真が含まれていた。 研究チームは、2秒間の音声クリップ3億1,300万個からなる大規模なデータセットでトレーニングされたマスク付きオートエンコーダを使用しました。線形プローブにより、HeAR は 6 つのデータセットにわたる 33 の健全な音響タスクのベンチマークで、すべての健全なオーディオ埋め込みモデルの中で SOTA パフォーマンスを達成しました。 図 | HeAR は、33 の健康オーディオ タスクで最高の平均ランキング (MRR = 0.708) を達成し、他のすべてのベースライン モデルを上回りました。 HeAR は、FSD50K および FluSense データセットで他のモデルよりも優れており、特に FSD50K でトレーニングされたモデルの中で 2 位にランクされています。 図|FSD50K および FluSense データセットにおける健康音響イベント検出タスクのパフォーマンス比較。 HeAR は、人口統計、ライフスタイルを含む 14 の咳推論タスクのうち 10 でベースライン モデルを上回ります。 TB および CXR タスクでは、そのパフォーマンスは最高のモデルに匹敵します。 図|咳推論タスクの性能比較。 HeAR は、SpiroSmart データセットの 4/5 肺機能テストタスクと性別分類タスクでベースライン モデルを上回ります。 図|肺機能検査課題の成績比較。 CIDRZ データセットでの HeAR のパフォーマンスは、さまざまな記録デバイスの影響を受けず、さまざまなデバイスに対して堅牢です。さらに、HeAR はトレーニング データが少ない場合でも優れたパフォーマンスを実現できるため、ラベル付きデータが不足している医療研究においてさらに有利になります。 ただし、HeAR にも一定の制限があります。たとえば、線形プローブではモデルのパフォーマンスの可能性を十分に引き出すことができず、一部のデータ セットは規模が小さくクラスの不均衡の問題があり、HeAR などのモデルは大きく、携帯電話などのデバイスで実行するのが困難です。 研究チームは、今後はモデルの微調整や機能の追加によるパフォーマンス向上のほか、より多くのデータの収集やデータ前処理方法の改善も検討する可能性があると述べた。また、モデルをローカルデバイスで実行できるようにするために、モデルの圧縮と量子化の技術を研究することも検討できます。 AI支援による病気診断には大きな可能性がある 医師の補助から病気の単独診断まで、AIは医療分野でますます活用され、大きな可能性を示しています。 今年6月、インペリアル・カレッジ・ロンドンとケンブリッジ大学の研究チームは、AIモデルEMethylNETを訓練し、DNAメチル化パターンを観察することで、非がん組織から13種類のがん(乳がん、肝臓がん、肺がん、前立腺がんなど)を識別し、その精度は最大98.2%に達した。 7月には、ボストン大学の研究チームとその協力者らが開発したAIツールが、10種類の認知症を(同時に)診断するのに役立ち、神経科医の診断精度が26%以上向上すると期待されている。 最近、AIは、子供たちの「目に見えない殺人者」である自閉症をターゲットにした画期的な進歩も遂げています。カロリンスカ研究所の研究チームが開発したマルチモーダルデータ分析AIモデルは、生後12か月前後の子供の自閉症の初期兆候を検出できるだけでなく、2歳未満の子供を識別する精度も80.5%です。さらに重要なのは、プロセス全体では比較的限られた情報しか必要としないことです。 近い将来、AI が人間によるより多くの病気の診断に役立ち、医療健康分野にさらなる可能性をもたらすことが予測されます。 |
<<: 北京と天津の人々が感染しました!この虫を見つけたら、叩かないでください。
>>: 砂漠でカニを養殖できますか?はい、あなたのテーブルにやって来ます!
私たちは生活の中で、緑の野菜、大根、ナス、トマト、コリアンダー、枝豆、ササゲなど、たくさんの野菜を食...
ご存知ですか?酢に浸した玉ねぎは老化を遅らせることができます。伝統的な中国医学では、タマネギには胃腸...
Google香港は本日、ホワイトペーパー「スマートデジタルシティ - シティワイドAI」の初版を公...
ヨーグルトは、よくヨーグルトと呼ばれます。ヨーグルトを飲むのが好きな人もいれば、そうでない人もいます...
研究により、アスパルテームは心臓血管系に損傷を与える可能性があることが判明しました。砂糖抜きの飲み物...
21世紀の社会は忙しい社会です。このような社会では、人々は仕事や勉強に忙しく、リラックスする時間はほ...
春節に必ず食べるべき食べ物は何ですか?餃子はリストに必ず入れてください!餃子は古代中国の餃子に由来し...
多くの人がエビを食べる最大の理由は、エビの美味しさに懐かしさを感じるためで、食事を注文するたびにエビ...
豚肉は私たちの生活の中で最も一般的な肉であり、特にテンダーロインは香りがよく脂っこくないため、人々に...
ヘチマは多くの人に好まれています。この種類の野菜はカロリーが低く、さまざまな方法で食べることができま...
気温が上昇するとハエはより活発になります。ハエの飛行軌道は予測できないため、ハエを打つことは技術的な...
アメリカの雑誌「MITテクノロジーレビュー」は最近、次世代のiPhoneにはセラミックケースが採用さ...
2021年、インドにおける産業用ロボットの新規導入台数は4,945台と過去最高を記録した。これは前年...
春祭りが近づいてきましたどこもお祭り気分が盛り上がっています祝祭シーズン中あなたのスーツケースはこん...
ノキアはかつて王者だった。かつては、最高の工業デザイン、最高の携帯電話品質、最高のブランド価値、最高...