Юрген Шмідхубер (нім. Jürgen Schmidhuber народився 17 січня 1963, Мюнхен, ФРН)[9] німецький і швейцарський вчений, фахівець у галузі штучного інтелекту. Є со-директором інституту досліджень штучного інтелекту Далле Молле[en] в Манно (кантон Тичино) у Південній Швейцарії. Виходячи з даних Google Scholar, з 2016 по 2021 його процетували понад 100 000 разів. Його називають «батьком штучного інтелекту», однак сам він вважає «батьком штучного інтелекту» Івахненко Олексія Григоровича.[10]

Коротка інформація Юрген Шмідхубер, нім. Jürgen Schmidhuber ...
Юрген Шмідхубер
нім. Jürgen Schmidhuber
Thumb
Народився17 січня 1963(1963-01-17)[1][2] (61 рік)
Мюнхен, Німеччина[2]
Країна Німеччина[3]
Діяльністьінформатик, дослідник штучного інтелекту, викладач університету, співзасновник
ГалузьШІ[4]
Alma materМюнхенський технічний університет (1991)
Науковий ступіньдокторський ступінь[2] (1991)
Науковий керівникWilfried Brauerd[5][2] і Клаус Шультен[5][2]
Знання мовнімецька[2] і англійська[2]
ЗакладІнститут дослідження штучного інтелекту Далле Моллеd[4][6], Мюнхенський технічний університет і USI[7]
ЧленствоЄвропейська академія наук і мистецтв і European Laboratory for Learning and Intelligent Systemsd[8]
Посадаад'юнкт[7][2]
Нагороди

IEEE Neural Networks Pioneer Awardd (2016)

Закрити

Шмідхубер закінчив Мюнхенський технічний університет і з 2004 по 2009 роки обіймав у рідному університеті посаду професора когнітивної робототехніки.[9] В 2009 він стає професором штучного інтелекту в Університеті Лугано в Швейцарії.

Робота

Шмідхубер разом зі своїми учнями Сеппом Хохрайтером[en], Феликсом Герсом[en], та іншими, працювали над більш складною версією рекурентної нейронної мережі, яку автори назвали «Довга короткострокова пам'ять» (LTSM). Перші результати були представлені в дипломній роботі Хохрайтера (1991 рік), в якій аналізувалась та вирішувалась відома проблема зникання градієнта.[11] Назва LSTM була введена в технічний звіт (1995 рік), що призвело до найбільш цитованої публікації LSTM (1997).[12]

Стандартна архітектура LSTM, яка використовується майже у всіх сучасних додатках, була представлена у 2000 році.[13] Теперішній «ванільний LSTM», який використовує зворотне поширення в часі, був опублікований у 2005 році[14][15] та його навчальний алгоритм тимчасової коннекціоністської класифікації (CTC)[en]. У 2006 році в CTC з'явилась можливість розпізнавання мови за допомогою LSTM. У 2015 році LSTM, навчений за допомогою CTC, був використаний у новій реалізації розпізнавання мовлення у програмному забезпеченні Google для смартфонів. Google також використовував LSTM для розумного помічника Allo[16] та для Google Translate.[17] Apple використовувала LSTM для функції «Quicktype» на iPhone[18][19] та для Siri.[20] Amazon використовував LSTM для Amazon Alexa.[21] У 2017 році Facebook виконував приблизно 4,5 мільярда автоматичних перекладів щодня за допомогою LSTM.[22] Бізнес-тиждень Bloomberg писав: «Ці здібності роблять LSTM, можливо, найбільш комерційним досягненням штучного інтелекту, який використовується для всього, від прогнозування захворювань до створення музики».[23]

У 2011 році команда Шмідхубера в IDSIA[en] з його постдоком Деном Сіресаном також досягла різкого прискорення роботи згорткових нейронних мереж (CNN) на швидких паралельних комп'ютерах, які називаються графічними процесорами (GPU). Раніше CNN, який застосовувався на GPU від Chellapilla et al. (2006), був в 4 рази швидше, ніж еквівалентна реалізація на центральному процесорі (ЦП).[24] Глибокий CNN Дена Сіресана та ін. (2011) в IDSIA був в 60 разів швидше[25] і досяг першого надлюдського результату на конкурсі комп'ютерного зору в серпні 2011 року.[26] У період з 15 травня 2011 року по 10 вересня 2012 року їх швидкий та глибокий CNN виграв не менше чотирьох конкурсів зображень.[27] Вони також значно покращили найкращі показники в літературі для кількох баз даних зображень. Цей підхід став центральним у сфері комп'ютерного зору.

Дослідження Шмідхубера також включають генералізацію колмогорівської складності та метрики «швидкість важлива» (Speed Prior[en]), створення концепції машини Геделя[en].

У 2014 році Шмідхубер заснував компанію Nnaisense для роботи у сфері комерційного застосування технологій штучного інтелекту у таких галузях як фінанси, важка промисловість та безпілотні автомобілі. Сепп Хохрайтер[en] та Яан Таллінн займають у компанії посаду радників. У 2016 році продажі становили менше 11 мільйонів доларів США; проте Шмідхубер стверджує, що нині акцент робиться на дослідженнях, а не на доходах. Nnaisense залучила перше фінансування в січні 2017 року. Загальна мета Шмідхубера — створити універсальний штучний інтелект шляхом навчання одного ШІ послідовно для виконання різноманітних вузьких завдань.

Визнання

У 2013 році Шмідхубер отримав Приз Гельмгольца від Міжнародного товариства нейронних мереж та Нагороду Піонера Нейронних Мереж від Товариства обчислювального інтелекту IEEE[fr] у 2016. Шмідхубер є членом Європейської академії наук та мистецтв.

Примітки

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.