Autor Beitrag
Balmung der blaue Gott
ontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic star
Beiträge: 52

WinXP

BeitragVerfasst: So 15.01.06 18:54 
Hallo,

Ich will mit Delphi ein Programm schreibt,
dass (unter WindowsXP) verschiedene Wörter erkennen kann.
Die Wörter sollen über ein Headset eingegeben werden.
Ich weiß, das das ein sehr kompliziertes Thema ist.
Ich brauche momentan nur einen Ansatz von euch, wie ich weiter komme
(auf google bin ich schon selbst gekommen :P).
Für den Anfang würde es mir schon reichen, wenn ich in dem Programm
überhaupt erkennen könnte, wenn ich etwas sage. Ich würde mich dann
über das Erkennen einzelner Buchstaben weiterarbeiten.
Also, was muss ich dazu einbinden, welche wichtigen Befehle gibt es?


Vielen Dank für eure Hilfe,
Balmung
Alstar
ontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic starofftopic star
Beiträge: 827



BeitragVerfasst: So 15.01.06 19:03 
Siehe: Suche in: Delphi-Forum SPRACHERKENNUNG

Alstar
Marco D.
ontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic star
Beiträge: 2750

Windows Vista
Delphi 7, Delphi 2005 PE, PHP 4 + 5 (Notepad++), Java (Eclipse), XML, XML Schema, ABAP, ABAP OO
BeitragVerfasst: So 15.01.06 19:04 
Hallo, lies dir mal dies durch:

www.delphi-forum.de/...ight=spracherkennung

www.delphi-forum.de/...ight=spracherkennung

www.delphi-forum.de/...ight=spracherkennung




Willst du jetzt immer noch diese (in meinen Augen unlösbare) Aufgabe angehen?

_________________
Pascal keeps your hand tied. C gives you enough rope to hang yourself. C++ gives you enough rope to shoot yourself in the foot
Allesquarks
ontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic star
Beiträge: 510

Win XP Prof
Delphi 7 E
BeitragVerfasst: So 15.01.06 19:11 
Einbinden Befehle???????? Bei Spracherkennung. Wenn es nur daran hapert die richtigen Komponenten für Spracherkennung zu nutzen frage ich mich warum diese Programme so selten sind.

Du musst dir ne Tonspur oder so was vom Mikrophon einlesen. Bemerken ob was gesagt wird. Einfach auf Amplituden schauen.
Wissen was gesagt wird. Forschungsarbeiten über menschliche Sprachcharakteristika lesen am besten selber eine schreiben. => Im besonderen Ähnlichkeiten einer speziefischen Stimme zum Durchschnitt. Forschungsarbeit über wie viele Silben spricht ein Mensch wirklich richtig aus, so dass ihn andere noch verstehen (denn er will ja mit dem Computer nicht anders reden) und daraus resultierend erstmal dem Computer menschliche Sprachsemantik beibringen und dich in "fehlertolerante Ähnlichkeitsalgorithmen" einarbeiten (hab ich jetzt mal so genannt (Suchfunktionen von Antivirenprogrammen würde ich für vergleichbar halten, da die ja auch nicht nur einen reinen Datenbankabgleich durchführen)).
Balmung der blaue Gott Threadstarter
ontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic star
Beiträge: 52

WinXP

BeitragVerfasst: So 15.01.06 20:22 
Hi,

@Alstar & Koller: Hab' ich doch schon gelesen. Ich brauch aber einen handfesten Ansatz.
Wenn es sowas nicht gibt, muss ich mich wohl bei Amazon durchwühlen.

Ich hab' mir ja schon fast gedacht, dass es noch keine Klassen dafür gibt.

@Allesquarks: Das mit dem Einlesen der Tonspur würde mich interessieren. Könntest du das erläutern? Ach, ja und wie gesagt, ich suche erstmal nur einen Enstieg in das Thema. Das mit der Forschungsarbeit würde mir also etwas zu weit gehen :)
Es soll ja nur ein bescheidenes Programm werden, dass zum Beispiel Ja von Nein unterscheiden kann. Ich will es wenigstens versuchen. Ich glaube, dabei kann ich schon viel lernen. Mein erstes Problem ist es an die Daten ranzukommen, die ich durch das Headset eingebe. Vielleicht lasse ich die Daten dann von einem Neuronalen Netzwerk auswerten (auch eine sehr interessante Sache, wollte ich sowieso schon mal programmieren). Das ganze sollte ja auch nur für mich bzw. nur für meine Stimme funktionieren. Für alles andere muss man sowieso Profi sein.
Balmung der blaue Gott Threadstarter
ontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic star
Beiträge: 52

WinXP

BeitragVerfasst: So 15.01.06 20:41 
Windows hat doch schon eine Speech Recognition Engine. Kann man die nicht nutzen?
Alstar
ontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic starofftopic star
Beiträge: 827



BeitragVerfasst: So 15.01.06 21:00 
Hi!

Erstmal die Grundlagen wie eine Spracherkennung überhaupt funktioniert: Spracherkennung - Wikipedia

Und hier Informationen zur Microsoft Speech Recognition: How to install and configure speech recognition in Windows XP
Microsoft Speech API

Alstar
Balmung der blaue Gott Threadstarter
ontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic star
Beiträge: 52

WinXP

BeitragVerfasst: So 15.01.06 23:32 
Danke, Alstar. Ich denke ich schlag mich erst mal 'n bisschen mit dem MS SpeechSDK rum.
Pepe
ontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic star
Beiträge: 107

Win 98, Win 2000 Prof., Win XP Prof.
Delphi 2005 Prof.
BeitragVerfasst: Di 24.01.06 21:43 
VoiceXML solltest du dir als allgemeingen standart vielleicht auch mal anschauen, sowie wie das Eclypse Voice Project