Новая модель Llama-3.1-Nemotron-70B-Instruct от NVIDIA: новый шаг к доминированию в сфере искусственного интеллекта
NVIDIA решила отказаться от одной из крупнейших в отрасли моделей Llama-3.1-Nemotron-70B-Instruct LLM, превзойдя OpenAI GPT-4o и Claude 3.5 Sonnet от Anthropic. Компания стремится к доминированию в сегменте искусственного интеллекта и представила свою новую модель LLM, нацеленную на улучшение ответов пользователей.
Команда NVIDIA ускоряет темпы инноваций в сегменте искусственного интеллекта, и после того, как они, кажется, доминировали в сегменте “аппаратного обеспечения для искусственного интеллекта”, теперь они собираются продемонстрировать свою магию в открытых моделях LLM, сотрудничая с Meta. Новая модель Llama-3.1-Nemotron-70B-Instruct от NVIDIA пока не получила широкого освещения в СМИ, но основываясь на доступной начальной информации и бенчмарках, новая модель LLM от Team Green может оказаться ведущей в отрасли.
NVIDIA утверждает, что модель Llama-3.1-Nemotron-70B-Instruct разработана исключительно для того, чтобы делать ответы искусственного интеллекта более конкретными и соответствующими предпочтениям человека, особенно в терминах фактической правильности и последовательного решения проблем. Модель, как утверждается, обучена на базе Llama-3.1-70B-Instruct от Meta, которая, в свою очередь, является созданием Meta, разработанным для 70 миллиардов параметров. Благодаря тонкой настройке от NVIDIA, Llama-3.1-Nemotron-70B-Instruct специально нацелена на “SteerLM Regression Reward Modelling”.
Модель Llama-3.1-Nemotron-70B-Instruct от NVIDIA смогла решить проблему с “клубникой”, которую традиционные модели искусственного интеллекта не могли решить, где требовалось посчитать количество букв “R” в слове. Это не единственное достижение, и предстоящие детали могут удивить читателей еще больше. Модель Llama-3.1-Nemotron-70B-Instruct от NVIDIA заняла лидирующее место во многих бенчмарках, в частности, в Arena Hard, автоматическом инструменте оценки для моделей LLM, настроенных на инструкции.
Критическим элементом здесь является то, что модель Llama-3.1-Nemotron-70B-Instruct смогла превзойти основные модели LLM в отрасли, такие как GPT-4o от OpenAI, что является значительным достижением, учитывая влияние тонкой настройки от NVIDIA на базу Llama-3.1-70B-Instruct. Мы еще не видели, как модель LLM проявляет себя в конкретных ситуациях, таких как сложные задачи программирования или проблемы, связанные с выводом, но начальные бенчмарки показывают, что новая модель LLM от NVIDIA хорошо подготовлена.
Если вы хотите получить доступ к модели Llama-3.1-Nemotron-70B-Instruct, вы можете сделать это на платформе “NIM” от NVIDIA или проверить совместимую версию на HuggingFace. В целом, команда NVIDIA на пути к доминированию в индустрии искусственного интеллекта, завоевывая основные сегменты.
