Das MIT Media Lab hat, um Menschen mit sozialen Phobien vereinfachte Trainings anzubieten, einen virtuellen Coach entwickelt. Gezielt soll es hier, so das MIT Lab, um Situationen gehen, wo Menschen vor Publikum sprechen müssen. Dieser virtuelle Coach kann Menschen mit Schwächen in der sozialen Kommuniaktion trainieren, lässt einen aber auch gezielt schwierige Gesprächssituationen einüben. Zukünftig soll diese Software auch zum Erlernen von Sprachen genutzt werden. Jonathan Gratch, Professor für Informatik und Psychologie an der University of Southern California sagt, „While it may seem odd to use computers to teach us how to better talk to people, such software plays an important [role] in more comprehensive programs for teaching social skills [and] may eventually play an essential step in developing key interpersonal skills“. Mag es, wie J. Gratch formulierte, seltsam erscheinen, dass Maschinen uns Menschen lehren, wie wir besser miteinander reden können, so sollte man auch die Vorteile dieser Software nicht aus den Augen verlieren. Zum einen ist es hiermit möglich, dass die Trainings zeitlich völlig individualisierbar sind und zum anderen – mag man es als Segen betrachten oder eben nicht – verkörpert diese Software eine programmierte Sozialtheorie originalgetreu und ist damit im Feedback wesentlich stringenter als ein menschlicher Trainer.
Erste Eindrücke gibt es hier:
Der sogenannte MACH (My Automated Conversation coacH), dessen Kernstück aus neuen komplexen Sprach- und Gesichtserkennungsalgorithmen besteht, kann sowohl Schwankungen in der Stimme als auch Mund-, Kopf-, und Augenbewegungen registrieren. Diese Software, entwickelt, um auf einem gewöhnlichen Laptop zu laufen, verwendet die Webcam eines Benutzers zur Erfassung der Mimik sowie von Bewegungen und das Mikrofon, um die Gesprächsthemen zu erfassen. Das MACH-System analysiert fortlaufend das Benutzerlächeln, Gesten, Sprache, Lautstärke und Geschwindigkeit als auch die Verwendung von Füllwörtern. Der automatisierte Interviewer – eine lebensgroße, dreidimensionale Simulation – kann lächeln und auf die Gesprächsthemen reagieren, d.h. bspw. nicken, Fragen stellen und Antworten geben.
Auch das Fraunhofer Institut für integrierte Schaltungen (IIS) stellte im März 2013 mit SHORE (Sophisticated High-speed Object Recognition Engine) eine Software zur Gesichtserkennung vor, welche neben den üblichen Funktionen auch Geschlecht, Alter und Stimmung (angry, happy, sad, surprised) erkennt und ein Tracking erlaubt. Ein Gedächtnis hat diese Software auch noch und erkennt Gesichter bis zu einer Pixelgröße von 24×24. Das ganze lässt sich für Windows auch als Demo-Version herunterladen.