High-End DeepLearning


Was DeepLearning für den ambitionierten Endverbraucher bedeutet ist simpel: man kauft sich eine Consumer GPU wie die Titan X von nvidia, lässt darauf die Caffe Software laufen und mit etwas warten kann man damit dann Hundefotos als solche identifizieren. Es gibt im Internet und bei Arxiv mehrere Paper die sich diesem Problem annehmen. Aber was ist richtiges DeepLearning woran aktuell gerade geforscht wird und was nicht allgemein zugänglich ist? Darum soll es im folgenden gehen.

Zunächst einmal benötigt man eine schnelle SSD wie die DSSD D5. Damit kann man zwar nicht direkt DeepLearning betreiben, aber man kann darauf die Dataset Datei speichern. Diese SSD hat eine Datenrate von 12500 MB pro Sekunde, kann 144 Terabyte speichern und kostet mehr als 1 Mio US$. Als Datensatz kämen beispielsweise Videoaufnahmen in Fragen, also Youtube-Kochvideos zum Beispiel.

Für das DeepLearning selber benötigt man noch eine CPU, ohne die geht es nicht. Die schnellste COTS Hardware ist derzeit die nvidia DGX-1 Hardware, was im Grunde ein Verbund aus SSD und GPU darstellt, Kostenpunkt: 120000 US$. Aber, die DGX-1 ist noch nicht das Ende der Fahnenstange sondern hat ebenfalls den Endverbraucher im Blick. Hardware die oberhalfb davon liegt ist derzeit:

– optalysys optical Computer (laut http://nextbigfuture.com/2014/08/17-exafflop-deep-learning-optical.html lassen sich damit 17 Exaflop realisieren)
– IBM Neuromorphic Computer Truenorth, https://www-03.ibm.com/press/us/en/pressrelease/49424.wss
– dwave 2 Quantum Computer

Wie hoch die Leistung solcher Hardware ist, ist derzeit nicht öffentlich bekannt. Man kann jedoch davon ausgehen, dass sie weitaus höher liegt als das was die nvidia DGX-1 Hardware liefert. Als konkreten Anwendungszweck wird von http://www.pcmag.com/news/343321/u-s-to-fight-cyber-attacks-with-brain-inspired-ibm-chip beispielsweise Cybersecurity genannt. Schaut man bei Arxiv einmal nach, welche konkreten Projekte mit optischen/quanten/neuromorphic Prozessoren bisher realisiert wurden, so erhält man dazu keine Aussage. Es gibt solche Paper schlichtweg nicht. Als Erklärung gibt es zwei Möglichkeiten: entweder die o.g. Hardware ist nur ein Phantasieprodukt und ist bis zum heutigen Tage nicht einsatzbereit oder aber sie funktioniert perfekt, es gibt dazu auch Paper nur werden diese nicht freigegeben. Schaut man sich einmal an, wo geographisch High-End-Hardware zum DeepLearning entwickelt wird so wird man die USA und UK identifizieren also jene Länder die ohnehin führend sind in Sachen Computing.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s