medisoftware Spracherkennung (mediSchnack) |
01.04.2026 |
Tippst du noch, oder schnackst du schon? - Ihr digitales Diktiergerät mit direktem Anschluss an die Patientenakte.
Sprachaufnahmen werden per KI (offline oder über einen Cloud-Dienst) transkribiert. Im Modus Strukturiert werden gesprochene Schlüsselwörter in Abschnitte zerlegt und als Karteikarten-Befehle exportiert; im Modus Freitext erfolgt nur die Transkribierung ohne Schlüsselwort-Suche und ohne Karteikarten-Export zur Weiterverarbeitung in beliebigen Textanwendungen.

Um die Spracherkennung nutzen zu können, benötigen Sie desweiteren ein Mikrofon. Falls Sie an einem Notebook sitzen, haben Sie wahrscheinlich schon eins und können direkt loslegen! Falls Sie eine Webcam an Ihrem PC haben: Die hat ebenso ein völlig ausreichendes Mikro.
Falls Sie eins anschaffen müssen:
Die Ergebnisse sind überraschend gut -- probieren Sie es einfach einmal aus!

Da der Installationsvorgang des KI-Moduls je nach PC ca. 5 bis 10 Minuten dauern kann, entscheiden Sie sich entweder für Später oder für Jetzt .
Nach dem Start der App aus der Karteikarte heraus können Sie direkt loslegen:

Schnelleinstellungen
Die Hotkeys für Aufnahme sind unter Einstellungen⇾Tastatur konfigurierbar.
Sprachbedienung (Steuerungs-Phrasen)Sagen Sie während des Diktats:

Das Ergebnis sieht im Praxis-Programm unter Verwendung der üblichen Schlüsselworte/Befehle (z.B. "Anamnese Doppelpunkt") während des Diktats wie gewohnt aus:



Gesprochene Phrasen (z.B. "Anamnese Doppelpunkt") und zugehörige Praxis-Programm Karteikarten-Befehle (Befehl/Typ).
Der Text nach dem Schlüsselwort wird dem jeweiligen Befehl zugeordnet (nur im Modus Strukturiert relevant).
Diese Liste kann nach Bedarf (pro Arbeitsplatz) geändert und erweitert werden.
Diktieren der Schlüsselwörter: Beim Diktat sollte dem Schlüsselwort stets ein "Doppelpunkt" folgen, danach der Inhalt.
Beispiel: Beispiel eines einzelnen Diktats mit mehreren Karteikartenbefehlen:
"Anamnese Doppelpunkt. Die Patientin klagt über Husten.Befund Doppelpunkt. Viraler Infekt. Therapie Doppelpunkt. Dreimal täglich ein Teelöffel Hustensaft nach dem Essen."
Stand: Februar 2026.
Wir haben nicht alle Geräte selbst getestet, die Empfehlungen basieren auf vergleichbaren Modellen.
Das erste Modell in der Tabelle haben wir ausgiebig getestet. Es liefert gute Ergebnisse, ist preiswert und hat eine gute Akku-Laufzeit. Ein Set besteht aus 2 Mikrofonen, so dass man schnell wechseln kann, falls sich der Akku leert.
Alternativ können Sie auch jede handelsübliche USB-Webcam benutzen! Die kosten nicht viel mehr - und Sie sind dann auch gleich für eine Videosprechstunde/Zoom/Teams u.s.w. ausgestattet.
Sprachaufnahmen werden per KI (offline oder über einen Cloud-Dienst) transkribiert. Im Modus Strukturiert werden gesprochene Schlüsselwörter in Abschnitte zerlegt und als Karteikarten-Befehle exportiert; im Modus Freitext erfolgt nur die Transkribierung ohne Schlüsselwort-Suche und ohne Karteikarten-Export zur Weiterverarbeitung in beliebigen Textanwendungen.

Hallo, hört mich jemand? ... Hallo??!?!
Voraussetzung für die Nutzung von mediSchnack ist Windows 11.Um die Spracherkennung nutzen zu können, benötigen Sie desweiteren ein Mikrofon. Falls Sie an einem Notebook sitzen, haben Sie wahrscheinlich schon eins und können direkt loslegen! Falls Sie eine Webcam an Ihrem PC haben: Die hat ebenso ein völlig ausreichendes Mikro.
Falls Sie eins anschaffen müssen:
- Es sollte per USB-Anschluss oder über 3,5 mm Klinkenstecker (den kennen Sie noch vom Walkman™?!) an den PC anzuschließen sein.
- Es muss keine besonderen Qualitäten haben. Wir haben in unseren Tests festgestellt, dass selbst die günstigsten Mikros gut funktionieren.
- Falls Sie auf Bewegungsfreiheit Wert legen, bietet sich ein Mikrofon mit Funkübertragung (Bluetooth oder 2,4 GHz) an. Vorteil: Unsere Diktiersoftware erkennt auch gesprochene Befehle wie "Diktat Start/Pause/Ende", mit der die Aufnahme gesteuert werden kann ohne den PC bedienen zu müssen, Sie können die Software also "Hands-Free" nutzen. Nachteil: Sie müssen - wie ein Handy - regelmäßig aufgeladen werden.
- Es gibt verschiedenste Varianten von PC-Mikrofonen: Tischgeräte mit Ständer, Clips für den Bildschirm, Raum-Mikros, die den gesamten Raum erfassen, Krawatten-Mikros, leuchtende, schwarze, weiße, bunte, blinkende... Weil wir Ihnen die Wahl überlassen möchten, und nicht dutzende Varianten lagern möchten, können Sie bei medisoftware keins bestellen.
- Keine Sorge, am Ende dieser Anleitung haben wir Ihnen eine Auswahl zusammengestellt, an der Sie sich orientieren können.
Allgemeine Informationen zur KI-basierten Transkribierung von Sprache zu Text
Der Einzug von KI-Modellen in das Thema "Spracherkennung" hat in den letzten Jahren enorme Fortschritte gemacht und hat bezüglich der Worttrennungsqualität klassische Spracherkennungsmethoden längst überholt: Noch vor Kurzem waren insbesondere für Fachtexte (Mediziner, Juristen, Angler, Segler) spezialisierte Wörterbücher und eingehendes Training erforderlich, um akzeptable Ergebnisse zu erhalten. Training und Fachwortschätze gehören nun der Vergangenheit an. Die "KI" "versteht", was Sie diktieren.Die Ergebnisse sind überraschend gut -- probieren Sie es einfach einmal aus!
Grammatik, Satzzeichen
Satzzeichen sollten nicht diktiert werden, da sie von der "KI" mal als Zeichen und auch mal als Wort interpretiert werden. Die "KI" fügt selbstständig Satzzeichen in den diktierten Text ein. Die Ergebnisse sind meist ziemlich gut. Hin und wieder muss man etwas nachkorrigieren -- je nach dem, ob man alte oder neue Rechtschreibungsregeln anwendet.Das Diktat
Hinweis: Vor dem allerersten Start der App kann/wird es vorkommen, dass der folgende Dialog erscheint:
Da der Installationsvorgang des KI-Moduls je nach PC ca. 5 bis 10 Minuten dauern kann, entscheiden Sie sich entweder für
Nach dem Start der App aus der Karteikarte heraus können Sie direkt loslegen:
- Überprüfen Sie, ob der richtige Patient geladen ist (Text ganz oben im Fenster).
- Klicken Sie auf den Aufnahmeknopf (im Bild rechts rot umrandet hervorgehoben) zum Starten des Diktats.
- Klicken Sie den Aufnahmeknopf erneut, um die Aufnahme zu pausieren.
- Beginnen Sie Texte, die als Befehl in der Karteikarte gespeichert werden sollen, mit deren Schlüsselwort + "Doppelpunkt". Beispiel: "Anamnese Doppelpunkt". Details zu den Schlüsselwörtern finden Sie weiter unten im Abschnitt Konfiguration.
- Alternativ können Sie die Aufnahme mit Kommandophrasen steuern: Sagen Sie
- "Diktat Start" um die Aufnahme zu starten oder nach einer Pause fortzusetzen.
- "Diktat Pause" um die Aufnahme zu pausieren.
- "Diktat Ende" um die Aufnahme zu beenden und die Transkription zu starten.
- "Diktat Abbruch" um die Aufnahme zu verwerfen.
- Klicken Sie am Ende des Diktats den "Stopp" Knopf. Anschließend startet die Transkription. Das dauert - je nach Länge des Diktats - einige Sekunden.
- Falls Sie sich verhaspelt haben und die Aufnahme verwerfen möchten: Der Rechte Button tut genau das.
- Achten Sie darauf, die Schlüsselwörter + "Doppelpunkt" deutlich auszusprechen -- falls sie fehlerhaft erkannt werden, wird der Text möglicherweise nicht oder nur unvollständig in die Karteikarte geschrieben. Der Rest des Diktats ist nicht so kritisch -- je länger die Sätze, desto mehr "Kontext" hat die Spracherkennung und desto besser die Ergebnisse. Daher haben gerade die kurzen Schlüsselwort-Sätze großen Einfluss auf das Ergebnis.
- Wenn die Transkribierung von schlechter Qualität ist oder die Schlüsselwörter häufig nicht richtig erkannt werden: Überprüfen Sie die Einstellung Ihres Mikrofon-Eingangspegels in den Einstellungen (Menü Datei {Einstellungen > Audioeinstellungen}).
- Die "Hands-Free" Steuerungsbefehle (wie zum Beispiel "Hey, Karteikarte", "Diktat Start", "Diktat Ende") werden mit einer Windows Funktion verarbeitet. Die Erkennung ist nicht in allen Fällen von Beginn an optimal. Das System "lernt" aber dazu und passt sich mit der Zeit an Ihre Stimme an.
Einschränkungen:
Aus technischen Gründen ist es nicht möglich, während des Diktats Korrekturen vorzunehmen. Falls Sie sich versprochen haben: Mit etwas Glück berichtigt die KI den Fehler. Oder Sie korrigieren anschließend im transkribierten Text.Bedienung

Schnelleinstellungen
- Modus-Umschalter: Strukturierter Text (Diktat von Befehlen in die Karteikarte wie z.B. ANAM) oder Freitext (für Word oder anderes Textprogramm) wählen.
- Umschalter Ergebnisfenster Ein/Aus: Fenster mit transkribiertem Text zur weiteren Verwendung anzeigen, (de)aktivieren. Für Freitext-Diktat muss das Ergebnisfenster eingeschaltet sein.
- Umschalter Sprachbefehle: (De)aktiviert die Erkennung der Sprachbefehle („Diktat Start/Pause/Ende“)
- Aufnahme-Button (Punkt): Schaltet zwischen Aufnahme und Pause um.
- Stopp-Button: Beendet die Aufnahme
Nach Stopp: Transkribierung läuft automatisch; Ergebnis wird (je nach Modus) angezeigt. Nur im Modus Strukturierter Text wird der Text als ein oder mehrere Befehl(e) in die Karteikarte des Patienten geschrieben; im Modus Freitext entfällt Schlüsselwort-Zerlegung und XML-Export. - Reset-Button: Verwirft die komplette Aufnahme unwiederbringlich.
- Aufnahme umschalten (Standard: Leertaste): Startet die Aufnahme bzw. pausiert oder setzt sie fort.
- Aufnahme beenden (Standard:
Tab ): Beendet die Aufnahme und startet die Transkription. - Aufnahme verwerfen Escape-Taste.
Sprachbedienung (Steuerungs-Phrasen)Sagen Sie während des Diktats:
- "Diktat Start" um die Aufnahme zu starten oder nach einer Pause fortzusetzen.
- "Diktat Pause" um die Aufnahme zu pausieren.
- "Diktat Ende" um die Aufnahme zu beenden und die Transkription zu starten.
- "Diktat Abbruch" um die Aufnahme zu verwerfen.
Aufnahmeverlauf
Im Hauptmenü können Sie sich unter Datei⇾Verlauf die letzten fünf Diktate ansehen:
Ergebnis im Praxis-Programm

Konfiguration
Über das Menü Datei⇾Einstellungen im Bereich Allgemein:
- Export-Ordner für Medisoft-XML (Standard: c:\voice2text\export).
- Standard-Mikrofon für Aufnahmen.
- Modus (Strukturiert/Freitext): Vorgabeeinstellung für den Start der Anwendung.
- Offline-Modell: Wählbar sind Parakeet (Default) und die Whisper-Modelle Tiny, Base, Small, Medium, Large. Ein noch nicht vorhandenes Modell wird auf Anfrage beim Speichern der Einstellungen heruntergeladen.
- Minimiert starten (im Bereich Allgemein, s. Bild oben, Standard: Aus): Wenn Ein, startet die Anwendung beim nächsten Öffnen nur in der Taskleiste (System-Tray). Das Fenster bleibt ausgeblendet; per Doppelklick auf das Tray-Icon oder über das Kontextmenü Wiederherstellen erscheint es wieder.
- Hier nicht beschriebene Einstellungen betreffen erweiterte Funktionen, sie sind meist mit Tooltip hinterlegt.

Gesprochene Phrasen (z.B. "Anamnese Doppelpunkt") und zugehörige Praxis-Programm Karteikarten-Befehle (Befehl/Typ).
Der Text nach dem Schlüsselwort wird dem jeweiligen Befehl zugeordnet (nur im Modus Strukturiert relevant).
Diktieren der Schlüsselwörter: Beim Diktat sollte dem Schlüsselwort stets ein "Doppelpunkt" folgen, danach der Inhalt.
Beispiel: Beispiel eines einzelnen Diktats mit mehreren Karteikartenbefehlen:
"Anamnese Doppelpunkt. Die Patientin klagt über Husten.Befund Doppelpunkt. Viraler Infekt. Therapie Doppelpunkt. Dreimal täglich ein Teelöffel Hustensaft nach dem Essen."
Voraussetzungen
- Windows 11.
- .NET 8 Desktop Runtime.
- Für Offline: Parakeet (Default) oder eines der Whisper-Modelle; das gewählte Modell wird bei Bedarf heruntergeladen.
Auswahl Mikrofone
Hier eine Liste geeigneter Mikrofone. Die Links führen zum Heise Preisvergleichsportal. Dort können Sie auch direkt eine Suche starten.Stand: Februar 2026.
Wir haben nicht alle Geräte selbst getestet, die Empfehlungen basieren auf vergleichbaren Modellen.
Das erste Modell in der Tabelle haben wir ausgiebig getestet. Es liefert gute Ergebnisse, ist preiswert und hat eine gute Akku-Laufzeit. Ein Set besteht aus 2 Mikrofonen, so dass man schnell wechseln kann, falls sich der Akku leert.
Alternativ können Sie auch jede handelsübliche USB-Webcam benutzen! Die kosten nicht viel mehr - und Sie sind dann auch gleich für eine Videosprechstunde/Zoom/Teams u.s.w. ausgestattet.
| Modell | Preis | Link |
| Lavalier Mikrofon kabellos | ca. € 20-25 | Link |
| DeLOCK USB Schwanenhals Mikrofon mit Standfuß | € 34,95 bis € 61,55 | Link |
| DeLOCK USB Krawatten Lavalier Mikrofon | € 38,95 bis € 46,99 | Link |
| Klim Talk Schwanenhals Mikrofon mit Standfuß | ca € 20,00 | Link |
| MillSO USB Lavalier Mikrofon (Clip) | ca. € 15,00 | Link |
| TONOR USB Konferenzmikrofon (Bildschirmklemme) | ca. € 30 | Link |
| aokeo USB Mikrofon Standgerät | ca. € 18 | Link |
| Moman Ansteckmikrofon Kabellos | ca. € 14 | Link |
| DJI Mic Mini (drahtlos) | € 44,90 bis € 108,00 | Link |
| RØDE Wireless Micro | € 87,00 bis € 179,00 | Link |