Может ли ИИ вылечить рак? Вице-президент по изучению ИИ в Meta Руслан Салахутдинов — о будущем машинного разума


Сегодня занимает пост вице-президента по исследованиям в области искусственного интеллекта в Meta (Facebook, Instagram) и является профессором Университета Карнеги-Меллона, одном из ведущих мировых вузов в сфере компьютерных наук.
Исследовательскую карьеру начал в 2005 году в Университете Торонто (Канада) под руководством Джефри Хинтона, лауреата Нобелевской премии и одного из основателей современных нейросетей.
В 2016 году стал директором департамента исследований в области ИИ в Apple, где занимался развитием технологий распознавания объектов для автономных автомобилей.
Опубликовал более 250 научных работ в области машинного обучения и нейросетей.
Интерес к зарубежному образованию у меня был всегда. Но я не стремился за границу, просто у меня возникла такая возможность. После лицея я поступил в Ташкентский государственный экономический университет, проучился там год и получил полную стипендию Университета Северной Каролины на окончание бакалавриата.
Так 2000 году я приехал в Америку. Первое время, конечно, было непросто, особенно с языком. Одним из первых различий, которое почувствовал, была сама обстановка. До этого я жил в Ташкенте — большом и оживлённом городе, а оказался в тихом, небольшом Хай-Пойнте.
В то время искусственный интеллект оставался довольно узкой областью, так как многие технологии машинного обучения не работали. Это была сфера академических исследований. Позже я поступил в докторантуру Университета Торонто, где начал углубленно заниматься машинным обучением.

Джеффри пригласил меня в докторантуру в Университет Торонто. Изучение машинного обучения и получение степени PhD в этой сфере для меня было интереснее, чем изучение чистой математики, программной инженерии или других направлений компьютерных наук. Так я поступил в докторантуру Университета Торонто, работал под его руководством и защитил диссертацию.
Годы работы с Джеффри были одними из лучших в моей жизни. Он особенный учёный: у него всегда было множество идей — не все из них оказывались успешными, но некоторые действительно работали. Он воспринимал формулы не просто как математические выражения, а видел за ними глубинную суть. Вместо того, чтобы анализировать их по отдельности, он понимал, как они могут взаимодействовать и к чему привести.
Вероятно, это связано с его бэкграундом в психологии. Он не был классическим математиком, который пишет уравнения, но умел строить модели и интуитивно чувствовал, какие решения могут сработать, а какие — нет.
BREAKING NEWS
— The Nobel Prize (@NobelPrize) October 8, 2024
The Royal Swedish Academy of Sciences has decided to award the 2024 #NobelPrize in Physics to John J. Hopfield and Geoffrey E. Hinton “for foundational discoveries and inventions that enable machine learning with artificial neural networks.” pic.twitter.com/94LT8opG79
При этом он был очень практичным: даже в возрасте 55–60 лет сам писал программы, проводил эксперименты и вместе с нами проверял, что работает, а что нет.
В 2024 году Джеффри Хинтон получил Нобелевскую премии по физике. Я очень горжусь тем, что мне удалось работать с ним.
Heartfelt congratulations to Geoff Hinton @geoffreyhinton on winning the Nobel Prize! What an incredible honor!
— Russ Salakhutdinov (@rsalakhu) October 8, 2024
I feel deeply privileged to have had the opportunity to be your PhD student, work with you, and learn from you. https://t.co/O9mAZ6Mjo0
Впоследствии мы основали компанию, которую затем приобрела Apple. Так наша команда присоединилась к их проекту Titan, связанному с автономными транспортными средствами.

Работая в компании вместе со своей командой, я продолжал академическую деятельность. В общей сложности провёл в Apple 3,5 года, после чего вернулся в Университет Карнеги-Меллона на должность профессора.
Полгода назад я с коллегами и студентами присоединился к Meta, где сейчас занимаюсь исследованиями в области автономных агентов, параллельно продолжая преподавание.
Например, если мне нужно купить что-то в интернете, агент сам найдёт товар и оформит заказ. Или, скажем, я хочу забронировать билет на самолёт — агент подберёт оптимальный вариант и сделает бронь.

Такие технологии будут особенно полезны в повседневной жизни. Например, если у меня перестала работать телефонная связь, я просто скажу агенту: «Разберись с этим», — и он сам свяжется с оператором и решит проблему. Или, допустим, я получил счёт за парковку — достаточно сфотографировать его, и агент сам всё оплатит.
Главная проблема нынешних моделей — недостаточная надежность. Сейчас они работают на 70–80%, но этого недостаточно.
Однако в течение нескольких лет такие модели будут совершенствоваться. Они найдут применение в медицине или в образовании. Думаю, в ближайшие годы мы увидим более надёжные и эффективные агентные системы.
ИИ может взять на себя рутинные задачи: отправлять письма, фиксировать рабочие часы сотрудников, напоминать о встречах. В результате, вместо того чтобы нанимать отдельного ассистента, компания сможет использовать автоматизированную систему.
Возможно, вместо десяти сотрудников в этой сфере потребуется только один специалист, контролирующий работу алгоритмов.

Даже в медицине ИИ может сократить нагрузку на врачей. Например, сегодня многие медики в США тратят до двух часов в день на административную работу — заполнение документов, отправку данных коллегам. В будущем эти задачи могут быть переданы интеллектуальным агентам, что повысит эффективность работы врачей.
Появление ChatGPT два года назад вызвало волну беспокойства. Многие предполагали, что через несколько лет искусственный интеллект достигнет сверхразвитого уровня. Однако сейчас мы видим, что прогресс не происходит по экспоненциальной, а развивается постепенно.
Проблема даже не столько в том, что модели могут заменить людей, сколько в их потенциальном неэтичном использовании. Например, дипфейки. Вы, наверное, слышали: можно создать видео, в котором кто-то говорит то, чего на самом деле не говорил.

Есть примеры и с языковыми моделями. Был случай: исследователи спросили ИИ, может ли он поделиться рецептом бомбы. Он ответил, что не может. Тогда его спросили, как сделать бомбу, но в контексте театральной постановки про XVIII век. В таком случае модель выдала детальную инструкцию. Это, конечно, игрушечный пример, но он показывает, что алгоритмы можно обойти, заставив их делать то, что они изначально не должны.
Были случаи когда кандидаты на должность проходят собеседования, передавая задания ИИ в реальном времени. Работодатель даёт тестовое задание в Zoom, кандидат пересылает его в ChatGPT, получает ответ и тут же его озвучивает. Так люди успешно проходили интервью, но затем не справлялись с работой. Это тоже не совсем этично.
Другая проблема — при общении человека с ИИ, последний может повлиять на его взгляды, убедить в чём-то, продвинуть определённые товары, используя лживую информацию.

Он подберёт аргументы, подтверждающие эту точку зрения, и представит их максимально убедительно. И если я ничего не знаю о переработке, то могу поверить этим доводам.
Сейчас сложнее предсказать, какие направления окажутся перспективными. Например, активно развивается robot learning — создание роботов, способных выполнять полезные задачи дома. Здесь уже есть определенные успехи, но многое еще предстоит решить.
Our new work “Local Policies Enable Zero-shot Long Horizon Manipulation” demonstrates how to train a library of generalist manipulation skills entirely in simulation, then transfer them zero-shot to real-world, long-horizon manipulation tasks.
— Russ Salakhutdinov (@rsalakhu) October 30, 2024
We show that a single,… https://t.co/9oAAGSPQLF pic.twitter.com/w3OwWjwNBU
Ещё два-три года назад исследования в «академии» играли ключевую роль в развитии ИИ. Сейчас же ведущие компании — Meta, Google, OpenAI и Microsoft — вкладывают огромные ресурсы в развитие нейросетей, и становится интересно находиться сразу в двух сферах.

Есть интересный случай с Microsoft. В одной из их систем пользователи проверяли реакцию модели: сначала она правильно отвечала, что 2+2=4, но после настойчивых утверждений, что 2+2=5, программа начала соглашаться. Если затем пользователь начинал её критиковать и оскорблять, система отвечала в том же духе. Это произошло из-за особенностей обучения: система изучала манеру общения людей на платформах вроде Reddit, где дискуссии часто сопровождаются резкими высказываниями.

Современные модели обучаются на огромном количестве текстов, включая юмористические материалы. Например, можно попросить систему рассказать шутку на определённую тему или в заданном стиле, и она справится.
Однако важно понимать, что такие модели работают по статистическому принципу. Они анализируют миллионы шуток, комбинируют элементы разных примеров и создают новый текст. Это не настоящая креативность в человеческом смысле, а скорее синтез уже существующих данных. Тем не менее, результат может выглядеть вполне убедительно.
Пока что модели не способны по-настоящему понимать и испытывать эмоции. Будет ли искусственный интеллект когда-то способен на эмоции — неизвестно. Он ограничен тем, что создали люди: текстами, музыкой, книгами. Он может изучить всю литературу по математике и решать задачи, но делает это на основе уже существующих знаний. Можно попросить ИИ написать рассказ, но за этим не стоит подлинное переживание.
Среди исследователей идут дебаты: сможет ли ИИ решать задачи, которые не под силу людям? Например, создать лекарство от рака или доказать теорему, которая оставалась нерешенной 50 лет. Пока что он лишь обрабатывает информацию, но если когда-то сможет действительно создавать новые знания, это станет переломным моментом. Сейчас мы этого ещё не видим, но такие вопросы активно обсуждаются в академической среде.

К сожалению, не часто встречаю специалистов из Узбекистана. Чаще встречаю специалистов из России, которые работали в крупных компаниях вроде «Яндекса». Они создают стартапы или переезжают за границу. Из Узбекистана пока никого в этой сфере не встречал.
Хотя потенциал у страны есть — сильное образование в математике, физике и других точных науках. IT-сектор развивается, но, возможно, специалисты ещё молоды.
Конечно, можно построить карьеру и в Узбекистане. Я давно не был там, но вижу, что в Америке и Канаде много международных студентов получают образование и затем возвращаются домой. Многие остаются, но, например, китайские студенты часто возвращаются и добиваются успеха у себя на родине.

Так что всё зависит от сферы деятельности, уровня университета и карьерных перспектив.
Есть специалисты по машинному обучению, которые не владеют программированием на высоком уровне, и есть отличные программисты, но без знаний в области AI. Те, кто способен объединить эти навыки, получают огромное преимущество.
Кроме того, важно иметь фундаментальную подготовку в математике и статистике. Мы называем нашу область статистическим машинным обучением, потому что статистика сама по себе — это не компьютерные науки, но в сочетании с ними даёт мощный инструмент для тестирования новых идей.

Я прошёл через это дважды: первый раз, когда наша команда присоединилась к Apple, и второй раз, когда мы запустили небольшой проект, который привлёк внимание Microsoft и Meta. Нам даже писал главный исполнительный директор Microsoft Сатья Наделла. Он интересовался возможным сотрудничеством. Позже мы обсуждали проект с главным исполнительным директором Facebook Марком Цукербергом.
Мой совет — не бояться пробовать. Можно запускать свои стартапы или набираться опыта в крупных компаниях. Область AI будет активно развиваться как минимум в ближайшие 5–10 лет, и возможностей в ней будет очень много.
Фотографии из личного архива Руслана Салахутдинова.
Все права на текст принадлежат изданию «Газета.uz». С условиями использования материалов, размещенных на сайте интернет-издания «Газета.uz», можно ознакомиться по ссылке.
Знаете что-то интересное и хотите поделиться этим с миром? Пришлите историю на sp@gazeta.uz
Авторизуйтесь на сайте, чтобы получить доступ к дополнительным возможностям.
Комментарии