Der Aal und die Disziplin der kleinen Schritte

Hast Du schon mal versucht, einen lebendigen Aal festzuhalten? Es wird dir kaum gelingen. Ich bin in Norddeutschland am Steinhuder Meer aufgewachsen, und dort gibt es Aale. Mit meiner Schulklasse war ich mal auf Besuch in einer Aalräucherei, und wir durften versuchen, einen Aal festzuhalten. Er rutscht dir durch die Finger. Länger als ein paar Sekunden hat es keiner geschafft.

Manchmal kommt es mir vor, dass der Mehrwert einer neuen technischen Lösung wie ein Aal ist. Da hat man Millionen in neue Software oder Dienstleistungen investiert, und am Ende ist man sich nicht sicher, ob dieses Investment einen messbaren Mehrwert für das eigene Unternehmen geliefert hat. Das scheint ein Trend über alle Branchen hinweg zu sein, besonders aber in moderner IT wie Cloud Computing tun sich IT Abteilungen schwer. Hersteller reagieren mit neuen Rollen wie „Customer Success Manager“. Eine Suche auf Xing nach diesem Job Titel ergibt heute 9070 Treffer. Diese Leute helfen Kunden, Mehrwerte einer Lösung zu realisieren.

In einer idealen Welt liefert ein Produkt nach der Installation seinen Mehrwert und alle sind zugfrieden. Aber die Welt ist nicht ideal. Gerade Lösungen, die einen Umbruch bedeuten, die besonders viel Mehrwert liefern sollen, erfordern eine Veränderung im Verhalten der Nutzer. Das fängt im Apple Store an, wo du dir erklären lassen kannst, wie der Umstieg auf Apple Produkte funktioniert. Aber noch viel mehr gilt dies in großen Unternehmen. Da spricht man dann oft von „Operational Transformation“, die Umstellung des IT Betriebs.

Darum bin ich ein großer Fan von kleinen Schritten: „Think big and start small.” Wenn der Mehrwert einer großen Idee nach kurzer Zeit schon in einer ersten Implementation sichtbar ist, dann kann der IT Leiter der Geschäftsführung besser belastbare Vorhersagen über zukünftige Mehrwerte liefern.

Sucht einen konkreten Use Case, der nah am Geschäft liegt. Definiert, wie ihr den Erfolg messen wollt. Denkt besonders daran, wie ihr den Erfolg einer Betriebsumstellung messen wollt. Und wartet nicht zu lange bis zum ersten Meilenstein.

Wenn ein besonderes Vertrauensverhältnis zwischen Kunde und Lieferant besteht, dann werden manchmal auch ganz große Projekte angestoßen, und neue Investitionen werden getätigt, bevor das vorhergehende Projekt einen messbaren Mehrwert geliefert hat. Das kann funktionieren, aber auf lange Sicht ist das ein Risiko für beide Seiten. Denkt an die Disziplin der kleinen Schritte.

Ein KI Spielplatz

Diese Woche war ich zur offiziellen Eröffnungsfeier des ARIC (Artificial Intelligence Center) Hamburg eingeladen. Das ARIC bringt Unternehmen, Start-Ups, Forschung, Banken und Politik zusammen, um KI-basierte Projekte zu initiieren und KI-Lösungen am Markt zu etablieren. Neben guten Gesprächen erlebte ich interessante Vorträge, in denen KI-Projekte vorgestellt wurden.

Ein sehr großes etabliertes Finanzunternehmen nutzt KI auf zwei Arten. Es gibt kurzfristige (in 1 bis 3 Jahre Laufzeit) Projekte, in denen moderne Anwendungen und neue Benutzerschnittstellen entwickelt werden. Langfristig werden in Zusammenarbeit mit dem ARIC ganz neue Geschäftsfelder angegangen, und die alten Prozesse fundamental zu verbessern, z.B. bei der Analyse von rechtlichen Dokumenten.

Ein Kommunikationsunternehmen stellte vor, wie sie KI nutzen, um die Effizienz und Reichweite von Marketingmethoden zu bewerten und zu optimieren. Ein Beratungsunternehmen zeigte, wie mit KI in der Bildanalyse Defekte an Triebwerke von Flugzeugen viel schneller kategorisiert werden können.

Es gibt viele Ideen, wie KI neue Geschäftsfelder treiben kann, und doch wirkte es auf mich ein bisschen wie ein Spielplatz. Das ist nicht negativ gemeint. Es geht um spielerisches Experimentieren. Es wird noch viel mehr probiert werden. Und es kommt darauf an, im kleinen Stil anzufangen und den Mehrwert von KI Lösungen zu beweisen, wie ich schon früher geschrieben hatte.

Je mehr KI-basierte Geschäftsmodelle funktionieren, desto mehr neue Ideen kommen dazu. Ich kann mir vorstellen, dass KI für viele Unternehmen noch sehr viel interessanter werden wird. Und zwar schneller als man denken mag.

Wirklich intelligente Maschinen

Die Definition von künstlicher Intelligenz kann schwammig sein. Manchmal scheint es nur brute force number crunching zu sein. Da wird über immer mehr Rechenleistung ein Verhalten erzeugt, dass Intelligenz zu zeigen scheint. Aber wenn wir hinter die Kulissen von Deep Blue und anderen Supercomputern schauen, die Spiele wie Schach oder Go meistern, dann sind das Sonderfälle, wo Wissen auf einem klar definierten Gebiet optimiert ist.

Die menschliche Intelligenz ist viel kreativer und anpassungsfähiger. Sie ist auf alle Fälle unseres Lebens vorbereitet, viel mehr als jeder Computer.

Und genau da setzt der 15 Jahre alte Klassiker von Jeff Hawkins und Sandra Blakeslee an: „On Intelligence“ ist ein Buch, in dem wir sehr detailliert die Einzelheiten lernen, wie das menschliche Gehirn funktioniert, wie der Neocortex aufgebaut ist, wie wir uns damit Dinge merken, und wie wir Entscheidungen treffen. Und genau diese biologische Vorlage nehmen die Autoren, um Hinweise zu geben, wie man wirklich intelligente Computer bauen kann.

Ein Kollege und Freund hat mir dieses Buch empfohlen, und ich kann diese Empfehlung nur weitergeben. Auch wenn die Vorhersagen von vor 15 Jahren nicht so richtig eingetroffen sind, ist es doch eine erhellende Lektüre.
„Die mächtigsten Dinge sind einfach.“, schreibt Jeff im Prolog. Er hat Recht, man mag nur an das iPhone denken. So wird in diesem Buch eine einfache und geradlinige Theorie der Intelligenz dargestellt. Es ist sehr tief gehend, wenn die einzelnen Zellen und Zellregionen im Gehirn erklärt werden, wie sie zusammenwirken, und wie Informationen gespeichert und abgerufen werden. Ja, du solltest dich beim Lesen konzentrieren, aber ist es auch für Nicht-Neurowissenschaftler verständlich.

Wenn nun eine Maschine dieses Verhalten des menschlichen Gehirns nutzt, dann ist sie wirklich intelligent. Jeff vermutet in diesem Buch, dass in 10 Jahren (das wäre 2015) solche intelligenten Maschinen existieren. Aber im nächsten Satz wird er gleich vorsichtiger, weil es auch länger dauern kann.

Jeff ruft dazu auf, solche Maschinen zu bauen, die den menschlichen Neocortex des Gehirns als Vorbild haben. In dem Buch gibt es einige Beispiele, z.B. wie solche Maschinen kommunizieren und das Wetter der Welt in einer Detailtiefe erfassen, die heute unmöglich scheint. Wollen wir das wirklich? Ich bin mir nicht sicher, ob das eine gute Idee ist. Und ich habe auch noch nichts weiter von solchen Maschinen gehört.

Wie dem auch sei, ich empfehle das Buch „On Intelligence“ jedem, der sich für intelligente Computer interessiert. Du wirst nach der Lektüre mehr Respekt vor deinem Gehirn haben.

Investitionen in AI und die Rolle von VMware

Auf der NORTEC 2020 Fachmesse für Produktion wurde ich zu einer Round Table Diskussion eingeladen, bei der es um die Einführung der KI in der Fertigungsindustrie ging. Große Unternehmen, Universitäten und lokale Wirtschaftsführer untersuchten, wie man mit KI Innovationen vorantreiben und einen Geschäftsplan dafür erstellen kann. Ich wurde gebeten, die Rolle der Virtualisierung für KI/ML-Projekte vorzustellen, und ein Datenwissenschaftler war interessiert (und überrascht) an den Leistungsvorteilen der Virtualisierung, wie sie im VROOM Blog-Artikel How Does Project Pacific Deliver 8% Better Performance Than Bare Metal? beschrieben sind.

Mehrere Vertreter und lokale Führungskräfte aus Privat- und Familienunternehmen diskutierten über ihr Geschäft. Kleine und private Unternehmen treiben die Wirtschaft in Norddeutschland an, hier gibt es nicht einen einzigen DAX-Konzern, aber viele kleine und mittlere Unternehmen. Ich war überrascht zu erfahren, dass diese kleineren Unternehmen ihren Umsatz viel schneller und stärker steigern als die großen öffentlichen Unternehmen. Die Übereinstimmung war, dass langfristige Investitionen die kurzfristigen Investitionen übertreffen. Öffentliche Unternehmen müssen den Shareholder-Value berücksichtigen und vierteljährliche Zahlen vorlegen. Es werden viele Entscheidungen getroffen, um die kurzfristigen Einnahmen zu steigern. Kleinere Unternehmen haben einen Zeithorizont von 10 bis 20 Jahren für ihre Investitionen, was zu einem stabileren und zuverlässigeren Geschäft führt. Sie arbeiten über viele Generationen hinweg.

Dies hat einen interessanten Einfluss auf ihre KI-Strategie. Diese Unternehmen können sich keine großen Investitionen leisten, deshalb haben wir gemeinsame Projekte mit Studenten der örtlichen Universitäten diskutiert. Diese Unternehmer können es nicht riskieren, große Summen zu investieren, weil sie die Risiken kontrollieren müssen. Aber sie sind sehr interessiert an der KI, und es gibt erste Unternehmen, die einen Wert aus der KI ziehen. Aber sie stehen erst am Anfang. Ein weiterer Hemmschuh sind die Bedenken gegen die Nutzung der Public Cloud für KI-Projekte, vor allem in Bezug auf die Einhaltung von Compliance und den Schutz des geistigen Eigentums. Daher werden sie KI/ML-Software auch in ihren lokalen Rechenzentren oder Standorten betreiben wollen. Der Umfang der Investitionen liegt oft nur bei etwa 10.000 bis 15.000 € für Hardware, so dass ich zunächst dachte, dies sei zu uninteressant für Cloud Infrastrukturanbieter wie VMware, die eher größere Projekte unterstützen. Aber ich wurde nach der Virtualisierung von AI/ML-Workloads gefragt, weil fast jeder gute Erfahrungen mit VMware vSphere (oder VMware Workstation) gemacht hat. Außerdem haben Universitäten und Forschungseinrichtungen wie das DESY wiederum ganz andere Größenordnungen abzudecken, was Infrastrukturprojekte mit Virtualisierung interessant machen kann.

Unerwartete Nebenwirkungen

Im Deutschlandfunk Podcast Die Maschine: Kontrolle ist gut, KI ist besser wird ab der 21. Minute eine schaurige fiktive Geschichte erzählt:

Es wurde eine künstliche Intelligenz entwickelt, die weltweit alle Medikamentenlieferungen kontrolliert und ausführt. Weil das so kritisch war, wurde ganz besonders viel wert auf einen speziellen Algorithmus gewählt, der Benachteiligung einzelner Bevölkerungsgruppen unter Garantie ausschließt, der immer 100% politisch korrekt ist.

Als nun die künstliche Intelligenz aktiviert wurde lief es zunächst gut, doch dann häuften sich in den reichen Ländern die Todesfälle von Diabetikern. Überall in den Krankenhäusern der Industriestaaten fehlt es an Insulin. Wie konnte das passieren?

Naja, das System funktionierte genau so, wie es entworfen wurde. Allerdings berücksichtigte die künstliche Intelligenz den Bedarf an Medikamenten weltweit. Für alle Menschen auf der Erde gab es aber nicht genug Medikamente wie Insulin. Unterversorgte Gebiete vor allem in Asien und Afrika bekamen von der künstlichen Intelligenz mehr Medikamente zugeteilt, die reichen Länder weniger. So wurde der Mangel global gleich verteilt.

Es ist ein ähnliches Dilemma wie zwei brennende Häuser, in denen Menschen eingeschlossen sind, du hast aber nur genug Helfer, um einen Brand zu bekämpfen und die Menschen zu retten, nicht beide Brände. Was machst du?

Das sind ethische Fragen, die eine künstliche Intelligenz nicht automatisch beantworten kann. Wenn also künstliche Intelligenz eingesetzt wird, um Leben zu erhalten, dann sollten wir ganz genau hinsehen. Und gut gemeint ist sicher nicht immer gut gemacht, wie die Geschichte von den Medikamenten zeigt.

ML Vorstellungsgespräch

Es gibt viele Varianten zu diesem Witz im Internet. So cool. Hier ist mein Favorit, den ich auf Twitter gefunden habe:

Interviewerin: Was ist Ihre größte Stärke?

Ich: Experte für maschinelles Lernen.

Interviewerin: Was ist 9 + 10?

Ich: 5.

Interviewerin: Nein. 19.

Ich: Es sind 14.

Interviewerin: Falsch. 19.

Ich: Es ist 19.

Interviewerin: Was ist 2 + 2?

Ich: 19.

Interviewerin: Sie passen perfekt in unser Team!

Wie eine kaputte Ehe

Es gibt Fälle, da denke ich IT und Business sind wie eine kaputte Ehe, und meine Arbeit ist die eines Familientherapeuten. Wie komme ich darauf?

Nun, bei einem Treffen von IT Spezialisten hatte ich mal gefragt, wer von den IT Experten hat den Druck, Infrastruktur schneller bereit zu stellen. Niemand hatte sich gemeldet. Alle meinten, ihre Arbeit sei ok.

Eine Woche später hatte ich bei der Machine Learning Conference ein paar Leute gefragt, wo sie Ihre Anwendungen laufen lassen. Sie sagten in der Public Cloud. Als ich fragte, ob sie überlegen, das auch im eigenen Rechenzentrum zu tun, starrten sie mich groß an: „Ich würde meine eigene IT Abteilung nie fragen, ob sie Machine Learning Anwendungen laufen lassen. Die sind viel zu langsam in der Bereitstellung.“

Kein Wunder, dass die IT Mitarbeiter keinen Druck spüren, dass Business fragt erst gar nicht nach schnellerer Bereitstellung, weil sie aufgegeben haben.

Das ist so wie in einer Ehe, wo die Ehepartner aufgegeben haben zu kommunizieren. Wenn man das lösen will, dann ist das harte Arbeit.

Nun gibt es sicher auch IT Abteilungen, die gut mit ihren Kunden in den jeweiligen Geschäftsbereichen zusammenarbeiten. Aber, liebe IT Leute, seid ihr sicher, dass ihr alle Anforderungen der Fachbereiche kennt? Reden sie noch mit Euch, oder haben sie aufgegeben? Es könnte eine gute Idee sein, Annahmen explizit zu validieren. Vielleicht gibt es ja doch noch ungenutztes Verbesserungspotential. Und liebe Fachbereiche, habt ihr Eure IT in letzter Zeit mal gefragt, ob sie nicht doch schneller reagieren können? Vielleicht habt ihr da Potential in der eigenen Firma übersehen?

Wenn IT zu langsam auf Geschäftsanforderungen reagiert, dann hat das in den wenigsten Fällen etwas mit Technik zu tun, da geht es um Prozesse und Teamstrukturen. Und vor allem geht es um Kommunikation. Vielleicht holt ihr euch Hilfe, um die Kommunikation wieder ins Laufen zu bringen.

Zwischen Hype und außergewöhnlichem Nutzen

Letzte Woche war ich auf der ML Conference in Berlin. Die Konferenz war sehr lehrreich für mich. In den Vorträgen ging es einerseits um die Technik hinter dem maschinellen Lernen, Data Science, Sicherheit und Algorithmen. Aber dann wurde auch darüber besprochen, wie ich ein ML Projekt aufsetze, welche Fehler begangen werden können, und warum Containertechnologien wie Docker oder Kubernetes ML Projekte sehr erleichtern. Am spannendsten fand ich aber die Vorträge, in denen es um konkrete Anwendungen von maschinellem Lernen und künstlicher Intelligenz ging. Und natürlich kamen auch die Gespräche mit anderen Teilnehmern nicht zu kurz.

Mein Fazit

Die meisten Unternehmen experimentieren zurzeit mit maschinellem Lernen. Es gibt wenig Ideen, wie diese neuen Technologien heute schon echte Vorteile für das Geschäft bringen. Der Hype in den Medien – sowohl das Positive als auch das Negative betreffend – war weit weg. Gleichzeitig stimmten alle, mit denen ich gesprochen hatte, darin überein, dass in ein paar Jahren jedes Unternehmen maschinelles Lernen einsetzen muss, um am Markt bestehen zu bleiben. Es wird der kleinste gemeinsame Nenner sein.

Dabei wird es sowohl in der Public Cloud als auch im eigenen Rechenzentrum genutzt werden. Das größte Problem im eigenen Rechenzentrum scheinen die langsamen Prozesse zu sein. „Es dauert viel zu lange, bis ich ein System aufgesetzt bekomme. Da bin ich in der Public Cloud viel schneller,“ wurde mir gesagt.

Aus Sicht meines Arbeitgebers VMware ist mir aufgefallen, dass einige Teilnehmer uns zwar kennen, aber keiner brachte VMware in Verbindung mit maschinellem Lernen und künstlicher Intelligenz. Dabei bietet VMware interessante Optionen an, wenn es um Flexibilität und Sicherheit der ML Anwendungen geht. Nun gut, das behandele ich ein anderes Mal.

Hier sind zwei Highlights aus meiner Sicht:

Wie wir Seeunfälle vermeiden

Die Keynote Data to the Rescue! Preventing Accidents at Sea von Dr. Yonit Hoffman des israelischen Startups Windward hat mich begeistert. Wusstet Ihr, dass 10% aller Schiffe einmal im Jahr eine Havarie haben? Mit Big Data Analysen und maschinellem Lernen hat Windward Modelle entwickelt um Unfälle vorherzusahen und auch zu verhindern. 150 Million Datenpunkte über Schiffspositionen, Schiffstypen, Wetterinformation, Wassertiefen, die Nähe zu Häfen, und viele weitere Daten wurden zusammengebracht und in tiefes Wissen und Verständnis über die Vorgänge auf See umgemünzt. Der Vortrag war wirklich fesselnd.

Die Ergebnisse haben zu einer sehr fruchtbaren und interessanten Zusammenarbeit mit Versicherungsunternehmen geführt. Stellt Euch mal vor, welche Welten da aufeinander treffen. Maritime Versicherungen arbeiten seit 350 Jahren auf ähnliche Weise – oft noch mit Papier. Jetzt entsteht etwas Neues. Und es ist ganz klar vom Geschäft getrieben. So stelle ich mir die Zukunft von maschinellem Lernen vor.

Regenabflussrohre für China

Das spannendste Gespräch war mit einem Mitarbeiter einer Firma, die Sanitäranlagen für große Gebäude und Regenwasser-Abflussrohre herstellt. Eine besondere Herausforderung sind große Flachdächer, z.B. für Industrieanlagen oder Geschäfte. Die Abflussrohre müssen genau den richtigen Durchmesser haben. Sind sie zu klein fließt zu wenig Wasser ab. Sind sie zu groß, entsteht kein Saugeffekt. Beim optimalen Durchmesser der Rohre entsteht ein Sog im Rohr, der das Regenwasser optimal ableitet.
Ich habe gelernt, dass viele Jahre Berufserfahrung nötig sind, um diese optimalen Rohre zu entwerfen. Das ist ein Problem, wenn man in neue Märkte gehen will. Nun hat das Unternehmen es geschafft, mit maschinellem Lernen optimale Regenrohrdurchmesser sehr viel schneller zu bestimmen. Damit ist es nun zum ersten Mal möglich, neue Märkte wie China anzugehen, auch ohne dort Mitarbeiter zu haben, die Jahrzehnte an Erfahrung besitzen.

Wenn maschinelles Lernen und künstliche Intelligenz heute schon auf diese außergewöhnliche Art Mehrwerte liefert, dann werden wir in Zukunft sicher noch mehr Beispiele sehen. Die Grenzen sind unsere Kreativität und Vorstellungskraft. Das Wissen um die Technik reicht nicht aus. Das ist nur eine notwendige, aber keine hinreichende Bedingung für den erfolgreichen Einsatz von maschinellem Lernen. Die Identifizierung von Geschäftsideen, das ist die wahre Herausforderung.

Guter Code ist wie gute Literatur

Die Grundlage vieler Innovationen ist Software. Software frisst die Welt („Software is eating the world“) sagte Marc Andreessen schon im August 2011. Software ist auch die Grundlage von allem maschinellem Lernen. Und woraus besteht Software? Aus Code. Da denke ich, es ist wichtig zu verstehen, was guter Code ist.

Ein guter Kollege empfahl mir zu diesem Thema das Buch „A Philosophy of Software Design“ von John Ousterhout. Der Name des Autors kam mir bekannt vor. Aber ich wusste nicht gleich, warum. Erst in einem späteren Kapitel, in dem John über die Tcl-Skriptsprache schrieb, wurde es mir klar. Ich hatte in den 1990er Jahren viel das Buch „Tcl and the Tk Toolkit“ desselben Autors benutzt. Ich entwickelte damals Linux-Gerätetreiber (ladbare Module für den Slackware Linux 0.99 Kernel) für ein Messsystem in meinem Physikstudium, und ich benutzte Tcl/Tk für die Anwendungs-Oberfläche.

„A Philosophy of Software Design“ ist cool. Es hat mich sehr stark an ein anderes Buch erinnert, das ich diesen Sommer gelesen hatte: „On Writing Well“ von William Zinsser. In dem Buch wird erklärt, wie man Texte aller Art schreibt. Sei klar und nutze kurze Sätze. Schreibe für dich, so wie du es gern lesen möchtest. Guter Code ist wie gute Literatur – er ist zeitlos. Die Software-Design-Tipps sind wie Tipps zum Schreiben von Literatur jeglicher Art – halte es einfach und vermeide Komplexität. Definiere gute Interfaces mit der richtigen Abstraktionsebene. Denke an andere Entwickler, die nach dir mit dem Code arbeiten werden.

Über Jahrzehnte hinweg haben sich diese Regeln nicht geändert. Und auch die scheinbar so agilen und schnellen Innovationen halten sich am Ende an diese Regeln, weil sie auf Code basieren. Und zwar idealerweise auf gutem Code.

DeepL – KI übersetzt am besten

Ich schreibe meine Artikel zuerst auf deutsch und hatte bisher Google Translate benutzt, um die englische Version zu erstellen. Das war zu ca. 80% gut, noch etwas poliert, dann war auch die zweite Sprache online.

Ein Kollege hatte mich gestern darauf hingewiesen, dass der DeepL Übersetzer eine viel bessere Übersetzungsmaschine für mich sein könnte. Ich habe es ausprobiert, und ich bin begeistert. Im direkten Vergleich mit Google Translate ist der DeepL Übersetzer um Längen besser darin, meine deutschen Artikel ins Englische zu übersetzen.

Was macht DeepL so besonders? Ich denke, es ist die konsequente Anwendung von neuronalen Netzen, maschinellem Lernen und künstlicher Intelligenz. Auf der DeepL Presse Webseite ist das so beschrieben:

„2016 – Das Team beginnt damit, ein neuronales Netzwerk zu konstruieren, das in der Lage ist, jede Art von Text zu übersetzen. Es wird später als DeepL Übersetzer bekannt. Dieses System baut auf jahrelanger Erfahrung des Teams mit maschinellen Lernverfahren und natürlicher Sprachverarbeitung auf und wurde mit über einer Milliarde hochqualitativer Übersetzungen trainiert, die durch Linguees Web-Crawler gesammelt wurden.“

Jetzt sind weitere 3 Jahre vergangen, und DeepL wird immer besser. Das ist es, was mich an guter Technologie so begeistert. Weiter so, DeepL Team!