3 Juni 2018

Die Forschungsorganisation für künstliche Intelligenz OpenAI hat kürzlich einen Bericht veröffentlicht, der zeigt, dass die Menge an Rechenleistung, die für Trainingsläufe in den größten maschinellen Lernsystemen benötigt wird, seit 2012 um das 300.000fache gestiegen ist.

Da sich die maschinellen Lernergebnisse verbessern, wenn zusätzliche Computerressourcen zur Verfügung gestellt werden, werden wahrscheinlich noch höhere Anforderungen an die Silizium-Infrastruktur gestellt, um bessere Ergebnisse zu erzielen. Unternehmen nutzen zunehmend maschinelles Lernen, um komplexe Probleme und Analyseaufgaben zu automatisieren. Aber die Forschung von OpenAI zeigt, dass eine wichtige Herausforderung vor uns liegt: Wie können Unternehmen die Infrastruktur aufbauen, die sie benötigen, um die gewünschten Geschäftsergebnisse zu erzielen, wenn sich die technischen Anforderungen ständig ändern?

Halten Sie es einfach

Zunächst einmal sollten Unternehmen versuchen, den am wenigsten komplizierten Algorithmus zu finden, der zur Lösung des jeweiligen Geschäftsproblems notwendig ist. Der Schlüssel liegt darin, die Komplexität so weit wie möglich zu minimieren. Während im Bereich des maschinellen Lernens derzeit massiv komplizierte neuronale Netze in Mode sind, lassen sich viele Probleme mit weniger aufwändigen Techniken leicht lösen. Beispielsweise werden Datenwissenschaftliche Wettbewerbe auf Kaggle oft von gradientenverstärkten Entscheidungsbäumen und nicht von tiefen neuronalen Netzen gewonnen.

Machen Sie sich schlau über die physische Infrastruktur

Zweitens sollten Unternehmen nur die Hardware kaufen, die sie benötigen, um die Anforderungen ihrer maschinellen Lernaufgaben zu erfüllen. Das mag offensichtlich erscheinen, aber es ist in diesem Fall besonders wichtig, weil die Siliziumhersteller ihre Produkte schnell ändern, um den Bedürfnissen dieses relativ neuen Marktes gerecht zu werden. Denken Sie an die neue Volta-Architektur von Nvidia, die eine dedizierte Beschleunigung für maschinelle Lernaufgaben beinhaltet.

Gegebenenfalls sollten Unternehmen Cloud-Plattformen einsetzen, die die Bereitstellung für Flotten von KI-Hardware vereinfachen, insbesondere für Workloads ohne festen Bedarf. Es ist viel einfacher, einen großen GPU-Cluster on the fly in einer der großen Clouds einzusetzen, als eine solche Umgebung in einem privaten Rechenzentrum zu beschaffen und einzurichten. Wenn dieser Cluster nicht mehr benötigt wird, können Unternehmen ihn schließen.

Im Moment erwartet OpenAI, dass die Top-Algorithmen auf Clustern laufen, die „einstellige Millionenbeträge“ kosten. Aber das Ausgehen und die Bereitstellung eines Clusters dieser Größenordnung macht keinen Sinn, es sei denn, es wird einem Geschäftsbedarf jetzt oder in unmittelbarer Zukunft gerecht.

Ziehen Sie Ihren Nutzen aus etablierten Stiftungen

Bevor man sich überhaupt mit der Bereitstellung großer Mengen an Silizium beschäftigt, sollte man sich auf ein oder zwei der populären Open-Source-Frameworks, die bei der Entwicklung und dem Einsatz von maschinellen Lernmodellen helfen, standardisieren. Googles TensorFlow scheint eine sichere Wette zu sein, da er im Open-Source-Bereich sehr beliebt ist, aber es gibt noch einige andere Optionen, wie z.B. Microsofts Cognitive Toolkit (CNTK), PyTorch (von Facebook verwendet) und Apache MXNet (Amazon’s bevorzugtes Framework).

Wenn Unternehmen wie Nvidia und Intel versuchen, optimierte Ausführungsumgebungen für maschinelle Lernalgorithmen auf ihrer Hardware bereitzustellen, konzentrieren sie sich oft auf eine Handvoll Frameworks wie die oben genannten. Diese Art von Software-Optimierungen kann zur Leistungssteigerung beitragen, ohne dass Unternehmen zusätzliche Hardware beschaffen müssen. Darüber hinaus erleichtern diese Frameworks die Erstellung maschineller Lernsysteme, und Unternehmen können diese Agilität nutzen, um neue Techniken zu nutzen, die in der Praxis entstehen, oder einfach nur verbesserte Methoden zur Behandlung bereits bekannter Probleme.

Unter dem Strich ist das maschinelle Lernen ein sich schnell veränderndes Feld, das Unternehmen dazu zwingt, kritisch über ihre Investitionen in die Infrastruktur nachzudenken und eine agile Umgebung zu schaffen. Die sich demnach an die Veränderungen des Standes der Technik anpassen kann und die massive Rechenleistung erfordern kann.

 

Dieser Beitrag basiert auf einem Artikel von venturebeat.com

Quelle Titelbild: iStock/ vadimguzhva