Wie Google DeepMind Ameisen Fußball Fähigkeiten helfen können, Ihre Suchergebnisse zu verbessern

Nach der Beherrschung von Dutzenden von 2D-Atari-Spielen und spannenden Menschen bei Go geht die DeepMind-Künstliche Intelligenz (AI) von Google nun auf neue 3D-Navigations- und Rätselspiele.

Eines dieser neuen Spiele, die DeepMinds AI-Agenten anpacken, ist Ameisenfußball, in dem es gelernt ist, einen Ball zu jagen, zu dribbeln und dann ein Tor zu erzielen.

Was ist beeindruckend, erklärte David Silver in einem Blogpost, dass seine KI in der Lage ist, die Ameisenfußball-Herausforderung “ohne vorherige Kenntnis der Dynamik” zu lösen, was die jüngsten Fortschritte widerspiegelt, die sie im “Bewehrungslernen” (RL) gemacht hat Versuch und Irrtum.

DeepMind hat ein Papier veröffentlicht, in dem erklärt wird, wie seine AI-Technologie nicht nur gelernt hat, wie man eine Vielzahl von Atari-Spielen spielt, sondern in einigen von ihnen erfolgreich war.

Um diese Ergebnisse zu erhalten, hat DeepMind RL mit einem tiefen Lernen neuronaler Netze und seinem Deep Q-Network (DQN) kombiniert, einem Algorithmus, der die Erfahrungen und Schätzungen eines Botes speichert, die er nach einer bestimmten Aktion erwarten kann.

Es war dieser Algorithmus, der es erlaubt, Dutzende von 2D-Spielen auf einem Atari 2600 zu meistern, aber Silber sagt, dass es jetzt eine weit bessere Version des Algorithmus entwickelt.

Zum Beispiel kann er nun ein einziges neuronales Netzwerk trainieren, um mehrere Atari Spiele zu lernen. Die Technik wird auch verwendet, um die Empfehlungen in Google Power.

Wir haben auch ein riesiges RL-System (Gorila) aufgebaut, das die Google Cloud-Plattform nutzt, um die Trainingszeit um eine Größenordnung zu beschleunigen.

Die Fähigkeit, zu lernen, wie man Fußball spielt, kommt von DeepMinds neu entwickelter asynchroner Akteur-kritischer Algorithmus, A3C, den das Unternehmen in einem überarbeiteten Papier in der vergangenen Woche unter Beweis stellte, dass es Standard-Multicore-CPUs verwenden könnte, um die GPU zu übertreffen -basierte Algorithmen zur Lösung von Motorsteuerungsproblemen und zum Navigieren von zufälligen 3D-Labyrinthen unter Verwendung von visueller Eingabe.

“Es erreicht state-of-the-art Ergebnisse, mit einem Bruchteil der Trainingszeit von DQN und einen Bruchteil des Ressourcenverbrauchs von Gorila,” Silber festgestellt.

DeepMind testet dies gegen Labyrinth, “eine anspruchsvolle Suite von 3D-Navigations- und Rätsellösungsumgebungen”. Die Agenten verwenden nur visuelle Hinweise, um herauszufinden, die Karte zu “entdecken und ausbeuten” Belohnungen, sagte Silber.

“Erstaunlich, erreicht der A3C-Algorithmus menschlichen Niveau Leistung, out of the box, auf viele Labyrinth Aufgaben”, schrieb er.

? Google DeepMind behauptet großen Meilenstein in Maschinen sprechen wie Menschen

? LG investiert in AI für intelligente Geräte, autonomes Fahren

? IBM, AI zu verwenden, um große Daten in seinem zweiten afrikanischen Forschungslabor zu zähmen

DeepMind

DeepMind AI gewinnt zweites Spiel gegen Korean Go-Champion, Googles DeepMind gewinnt Zugang zu breiten Schwaden der britischen Gesundheitsdaten, AlphaGo Spiel ‘ein Sieg für die Menschheit’: Eric Schmidt

Künstliche Intelligenz, Google-DeepMind behauptet großen Meilenstein bei der Herstellung von Maschinen sprechen wie Menschen, Innovation, LG Investitionen in AI für intelligente Appliances, autonome Fahren, Big Data Analytics, IBM IBM AI, um große Daten in seinem zweiten afrikanischen Forschungslabor zu zähmen, Künstliche Intelligenz, IBM Watson: Hier ist, was ein Film-Trailer von einem KI gefertigt aussieht

IBM Watson: Hier ist, was ein Film-Trailer in Handarbeit von einem AI aussieht