David Silver - Forscher (AlphaGo Zero)
Erfahrungen
Forscher (AlphaGo Zero)
DeepMind
Entwickelte einen Verstärkungslern-Algorithmus, der ausgehend von zufälligen Zügen ohne menschliche Daten, Anleitung oder Fachwissen jenseits der Grundregeln eine übermenschliche Spielstärke im Go erreicht.
Erzielte eine 100:0-Bilanz gegen die AlphaGo-Version, die den Weltmeister besiegt hatte.
Ersetzte separate Policy- und Value-Netzwerke durch eine einzige neuronale Netzwerkarchitektur mit vielen Residualblöcken aus Faltungsschichten mit Batch-Normalisierung und ReLU-Aktivierungen.
Implementierte eine vereinfachte Baumsuche, die sich auf ein einzelnes neuronales Netzwerk zur Positionsbewertung und Zugauswahl stützt, ohne Monte-Carlo-Rollouts durchzuführen.
Integrierte eine Suche mit Vorausschau in die Trainingsschleife, um schnelle Fortschritte und stabiles Lernen zu ermöglichen.
Entdeckte grundlegende Elemente des menschlichen Go-Wissens neu, darunter Joseki (Eckfolgen), Fuseki (Eröffnungsstrategien) und Leben-und-Tod-Konzepte aus den Grundprinzipien.
Optimierte das System so, dass es auf einer einzelnen Maschine mit 4 Tensor Processing Units (TPUs) in der Google Cloud läuft.
Forscher (AlphaGo Master)
DeepMind
Besiegte im Januar 2017 in Online-Partien die stärksten professionellen menschlichen Spieler mit 60:0.
Nutzte eine spezialisierte neuronale Netzwerkarchitektur und einen Verstärkungslern-Algorithmus, der dem AlphaGo-Zero-Framework entspricht.
Integrierte manuell erstellte Merkmale und Rollouts in den Suchalgorithmus.
Startete das Training durch überwachtes Lernen mit Daten menschlicher Experten.
Forscher (AlphaGo Lee)
DeepMind
Besiegte Lee Sedol, den Gewinner von 18 internationalen Titeln, im März 2016.
Implementierte ein verteiltes System über mehrere Maschinen mit 48 Tensor Processing Units (TPUs), um neuronale Netzwerke während der Suche zu bewerten.
Trainierte das Value-Netzwerk mit Ergebnissen schneller Selbstspiel-Partien von AlphaGo.
Setzte im Vergleich zu früheren Versionen eine größere Architektur für Policy- und Value-Netzwerke mit 12 Faltungsschichten ein.
Forscher (AlphaGo Fan)
DeepMind
Besiegte im Oktober 2015 den europäischen Meister Fan Hui.
Entwickelte und nutzte zwei tiefe neuronale Netzwerke: ein Policy-Netzwerk zur Ausgabe von Zugwahrscheinlichkeiten und ein Value-Netzwerk zur Bewertung von Positionen.
Trainierte das Policy-Netzwerk zunächst durch überwachtes Lernen, um Züge menschlicher Experten vorherzusagen, und verfeinerte es anschließend mit Policy-Gradient-Verstärkungslernen.
Trainierte das Value-Netzwerk, um den Gewinner von Partien vorherzusagen, in denen das Policy-Netzwerk gegen sich selbst spielte.
Kombinierte neuronale Netzwerke mit einer Monte-Carlo-Baumsuche (MCTS), um eine ausgefeilte Suche mit Vorausschau zu ermöglichen.
Forscher
Google Inc.
Ioannis Antonoglou: Veröffentlichte umfangreiche Forschung im Bereich KI und maschinellem Lernen, trug zu 36 Publikationen bei und erzielte über 10.375 Zitationen.
Yutian Chen: Veröffentlichte fortgeschrittene Forschung im maschinellen Lernen, trug zu 24 Publikationen bei und erzielte über 77.831 Zitationen.
Forscher
Microsoft
- Thore Graepel: Veröffentlichte einflussreiche Forschung im Bereich der Künstlichen Intelligenz, trug zu 206 Publikationen bei und erzielte über 33.474 Zitate.
Sprachen
Statistiken
Erfahrung
Globale Erfahrung
Fachkenntnisse
Profil
Häufig gestellte Fragen
Sie haben Fragen? Hier finden Sie weitere Informationen
Wo ist David ansässig?
Welche Sprachen spricht David?
Wie viele Jahre Erfahrung hat David?
Für welche Rollen wäre David am besten geeignet?
Was ist das neueste Projekt von David?
In welchen Industrien hat David die meiste Erfahrung?
In welchen Bereichen hat David die meiste Erfahrung?
Wie ist die Verfügbarkeit von David?
Wie hoch ist der Stundensatz von David?
Wie kann man David beauftragen?
Durchschnittlicher Tagessatz für ähnliche Positionen
Die Tagessätze basieren auf aktuellen Projekten und enthalten keine FRATCH-Marge.
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen
Experten, die kürzlich an ähnlichen Projekten gearbeitet haben
Freelancer mit praktischer Erfahrung in vergleichbaren Projekten als Forscher (AlphaGo Zero)
Freelancer in der Nähe
Fachkräfte, die in oder in der Nähe von Chemnitz, Vereinigtes Königreich arbeiten