
Spracherkennung wird in nahezu allen Bereichen des modernen Lebens integriert, aber es bleibt eine große Lücke: Sprecher von Minderheitensprachen und solche mit starken Akzenten oder Sprachstörungen wie Stottern sind in der Regel weniger in der Lage, Spracherkennungstools zu verwenden, die Anwendungen steuern, transkribieren oder Aufgaben automatisieren, sowie andere Funktionen.
Tobi Olatunji, Gründer und CEO des klinischen Spracherkennungs-Startups Intron Health, möchte diese Lücke überbrücken. Er behauptet, dass Intron die größte klinische Sprachdatenbank Afrikas ist, deren Algorithmus auf 3,5 Millionen Audio-Clips (16.000 Stunden) von über 18.000 Beitragenden trainiert wurde, hauptsächlich Gesundheitsdienstleister, aus 29 Ländern und mit 288 Akzenten. Olatunji sagt, dass die Mehrheit der Beitragenden aus dem Gesundheitssektor stammt, was sicherstellt, dass medizinische Begriffe für seine Zielmärkte korrekt ausgesprochen und erfasst werden.
„Da wir bereits viele afrikanische Akzente trainiert haben, ist es sehr wahrscheinlich, dass die Grundlinienleistung ihres Zugangs viel besser sein wird als bei jedem anderen Dienst, den sie verwenden“, sagte er und fügte hinzu, dass Daten aus Ghana, Uganda und Südafrika zunehmen und dass das Startup zuversichtlich ist, das Modell dort einzusetzen.
Olajunjis Interesse an Gesundheitstechnologie entstammt zwei Strängen seiner Erfahrung. Zunächst erhielt er eine Ausbildung und praktizierte als Arzt in Nigeria, wo er aus erster Hand die Ineffizienzen der Systeme auf diesem Markt sah, einschließlich des vielen ausgefüllten Papierkrams und wie schwer es war, alles zu verfolgen.
„Als ich vor ein paar Jahren Arzt in Nigeria war, sogar während des Medizinstudiums und auch jetzt, rege ich mich leicht auf, wenn ich eine sich wiederholende Aufgabe erledigen muss, die keine menschlichen Anstrengungen erfordert“, sagte er. „Ein einfaches Beispiel ist, dass wir den Namen eines Patienten auf jede Laboranforderung schreiben mussten, die wir machten. Und nur etwas, das einfach ist, sagen wir, ich sehe die Patienten und sie müssen einige Rezepte bekommen, sie müssen einige Labore bekommen. Ich muss jeden Auftrag manuell für sie ausschreiben. Es frustriert mich einfach, den Patientennamen immer wieder auf jedem Formular zu wiederholen, das Alter, das Datum und so weiter. … Ich frage immer, wie können wir Dinge besser machen? Wie können wir das Leben für Ärzte einfacher machen? Können wir einige Aufgaben entfernen und sie an ein anderes System abgeben, damit der Arzt seine Zeit damit verbringen kann, wertvolle Dinge zu tun?“
Diese Fragen trieben ihn in die nächste Phase seines Lebens. Olatunji zog in die USA, um einen Master-Abschluss in medizinischer Informatik von der University of San Francisco und dann einen weiteren in Informatik am Georgia Tech zu verfolgen.
Dann sammelte er Erfahrungen in mehreren Technologieunternehmen. Als klinischer Natural Language Programming (NLP)-Wissenschaftler und Forscher bei Enlitic, einem Unternehmen in der San Francisco Bay Area, baute er Modelle zur Automatisierung der Extraktion von Informationen aus radiologischen Textberichten. Er arbeitete auch als Maschinenlernwissenschaftler bei Amazon Web Services. Bei Enlitic und Amazon konzentrierte er sich auf die natürliche Sprachverarbeitung im Gesundheitswesen und formte Systeme, die es Krankenhäusern ermöglichen, besser zu funktionieren.
Im Verlauf dieser Erfahrungen begann er, Ideen zu entwickeln, wie das, was in den USA entwickelt und verwendet wurde, zur Verbesserung des Gesundheitswesens in Nigeria und anderen Schwellenländern wie diesem eingesetzt werden könnte.
Das ursprüngliche Ziel von Intron Health, das 2020 gestartet wurde, war die Digitalisierung der Krankenhausabläufe in Afrika durch ein elektronisches Patientenakten (EMR)-System. Die Akzeptanz gestaltete sich schwierig: Es stellte sich heraus, dass Ärzte lieber schrieben als tippten, sagte Olatunji.
Dies führte ihn dazu, zu erkunden, wie man dieses grundlegendere Problem verbessern könnte: wie man die grundlegende Dateneingabe, das Schreiben der Ärzte, effektiver gestalten könnte. Zunächst untersuchte das Unternehmen Lösungen von Drittanbietern zur Automatisierung von Aufgaben wie Notizennehmen und die Einbettung bestehender Sprache-zu-Text-Technologien in sein EMR-Programm.
Es gab jedoch viele Probleme aufgrund ständiger Fehltranskriptionen. Es wurde Olatunji klar, dass die starken afrikanischen Akzente und die Aussprache komplizierter medizinischer Begriffe und Namen die Übernahme bestehender ausländischer Transkriptionstools unpraktisch machten.
Dies markierte den Ursprung der Spracherkennungstechnologie von Intron Health, die afrikanische Akzente erkennen und in bestehende EMRs integriert werden kann. Das Tool wurde bisher in 30 Krankenhäusern in fünf Märkten, darunter Kenia und Nigeria, übernommen.
Es gab einige unmittelbare positive Ergebnisse. In einem Fall hat Intron Health nach Angaben von Olatunji dazu beigetragen, die Wartezeit auf Radiologieergebnisse in einem der größten Krankenhäuser Westafrikas von 48 Stunden auf 20 Minuten zu verkürzen. Solche Effizienzen sind in der Gesundheitsversorgung entscheidend, insbesondere in Afrika, wo das Arzt-Patienten-Verhältnis eines der niedrigsten der Welt bleibt.
„Krankenhäuser haben bereits so viel in Ausrüstung und Technologie investiert … Es ist wichtig, sicherzustellen, dass sie diese Technologien anwenden. Wir sind in der Lage, Wertbeiträge zu leisten, um ihnen zu helfen, die Einführung des EMR-Systems zu verbessern“, sagte er.
Ausblickend erforscht das Startup neue Wachstumsfronten, unterstützt durch eine Pre-Seed-Runde von 1,6 Millionen US-Dollar, angeführt von Microtraction, mit Beteiligung von Plug and Play Ventures, Jaza Rift Ventures, Octopus Ventures, Africa Health Ventures, OpenseedVC, Pi Campus, Alumni Angel, BakerBridge Capital und mehreren Business Angels.
In technologischer Hinsicht arbeitet Intron Health daran, die Geräuschunterdrückung zu perfektionieren, sowie sicherzustellen, dass die Plattform auch bei niedriger Bandbreite gut funktioniert. Dies kommt zusätzlich zur Ermöglichung der Transkription von Mehrsprecherkonversationen und der Integration von Text-zu-Sprache-Funktionen.
Der Plan von Olatunji ist es, Intelligenzsysteme oder Entscheidungsunterstützungstools für Aufgaben wie Verschreibungen oder Labortests hinzuzufügen. Diese Werkzeuge, fügt er hinzu, können dazu beitragen, Arztfehler zu reduzieren, eine angemessene Patientenversorgung sicherzustellen und ihre Arbeit zu beschleunigen.
Intron Health gehört zu den wachsenden Anzahl von generativen KI-Startups im medizinischen Bereich, darunter Microsofts DAX Express, die Administrativaufgaben für Kliniker reduzieren, indem sie Notizen innerhalb von Sekunden generieren. Das Aufkommen und die Übernahme dieser Technologien erfolgen, da der weltweite Sprach- und Spracherkennungsmarkt bis 2032 einen Wert von 84,97 Milliarden US-Dollar erreichen soll, nach einer jährlichen Wachstumsrate (CAGR) von 23,7% von 2024, so Fortune Business Insights.
Neben dem Aufbau von Sprachtechnologien spielt Intron auch eine entscheidende Rolle in der Sprachforschung in Afrika, hat kürzlich eine Partnerschaft mit Google Research, der Bill & Melinda Gates Foundation und Digital Square bei PATH eingegangen, um beliebte große Sprachmodelle (LLMs) wie OpenAIs GPT-4o, Googles Gemini und Anthropics Claude in 15 Ländern zu evaluieren, um Stärken, Schwächen und Risiken von Bias oder Schaden in LLMs zu identifizieren. Dies geschieht alles mit dem Ziel, sicherzustellen, dass kulturell angepasste Modelle für afrikanische Kliniken und Krankenhäuser verfügbar sind.