Дайджест полезных находок, инструментов, статей и видео из мира машинного обучения

Каждую неделю мир машинного обучения наполняется новыми открытиями, проектами и статьями, которые не только вдохновляют дата саентистов, но и расширяют горизонты знаний. В этой статье мы собрали для вас подборку самых интересных и актуальных материалов недели, которые помогут вам быть в курсе последних тенденций и достижений. Погрузитесь в мир инноваций и узнайте о проектах, которые заслуживают вашего внимания.

Интересные библиотеки:

 •Command R+ - Новая модель с открытым исходным кодом показывает крутые результаты на уровне с GPT-4 и Claude 3.  104 миллиарда параметров, 128к контекста

 • LLocalSearch - полностью локально работающая система метапоиска, использующая LLM-агентов. 

MagicLens: новое семейство моделей для поиска изображений от Google.

 • DINO-Tracker: Новая SOTA для отслеживания объектов. 

 • Stable Audio 2.0 Stability AI представили нейросеть Stable Audio 2.0 для генерации треков с вокалом.

 • SV3D - еще один проект от Stability AI-  новая модель для реконструкции изображения в 3D в хорошем качетсве.

 • Gaussian Head Avatar - качественная генерация  ваш 3D-аватаров сразу с нескольких ракурсов.

Financial Datasets - это библиотека Python с открытым исходным кодом, которая позволяет разработчикам создавать синтетические наборы финансовых данных с использованием больших языковых моделей 

Что почитать:

Как OpenAI создавали бота, который победил проигроков в Dota 2

Аппаратные требования больших языковых моделей ИИ сокращаются вдвое каждые восемь месяцев

Как обнаружить галлюцинации в LLM?

Браузерная интерактивная игра от tensorflow,  которая позволяет настраивать и обучать нейросеть

Mixture-of-Depths: распределение вычислений в LLM на основе трансформеров

Как мы реализовали текстовый поиск за 48 часов

Большая подборка вопросов для собеседования по DS, AI, ML, DL, NLP, компьютерному зрению

Open Source в российском ИИ: исследование ландшафта

Огромный список лучших бесплатных курсов Data Science.

Размышления о высококачественных данных, собранных людьми

Идеи улучшения точности, удобства и скорости языковых моделей

Введение в нейросети: что, зачем и как?

Как я стал специалистом по машинному обучению. Open AI и Dota 2

AutoBNN: Probabilistic time series forecasting with compositional bayesian neural networks

Introduction to LLM Ops: Reliable and Scalable LLM Integration

JRDB-PanoTrack: An Open-world Panoptic Segmentation and Tracking Robotic Dataset

Machine Learning in Application Development

Let's detect flowers! (with SageMaker and DeepLens)

FiftyOne Computer Vision Tips and Tricks - April 5, 2024

Trustworthy AI: Navigating the Ethical Challenges of AI Deployment and Decision-Making

SVM and Kernels: The Math that Makes Classification Magic

Get Hired Faster: How to use Lyzr-Automata to draft personalised cold emails

AI: The new Frontier Of War

Auto-Merging: RAG Retrieval Technique

Что посмотреть:

🌐 Введение в Трансформеры  от 3Blue1Brown. Неповторимый стиль автора, красивая анимация и подробное разъяснение сложных тем простыми словами (⏱ 27:13)

🌐 Эндрю Ын рассказывает о том, как будут развиваться ИИ-агенты (⏱ 13:39)

🌐 100 вопросов с собеседований Data Science (⏱ 36:48)

🌐 Continual Learning of Natural Language Processing Tasks with Bing Liu, PhD (⏱ 46:38)

🌐 Navigating the GENAI Frontier: Empowering Data Scientists as Ethical Innovators with Alison Cossette (⏱ 35:19)

🌐 Vision To Make 1% Top Data Data Scientist (⏱ 09:08)

🌐 ИИ против ИИ в Street Fighter III (⏱ 09:01)

Хорошего дня!