Назад
03 May 2025

Тестовая новость 2 чтобы проверить верстку

Альянс в сфере ИИ объявил о запуске нового раздела MERA «MERA Industrial» — уникального бенчмарка для оценки специализированных больших языковых моделей (LLM) в различных отраслях. На платформе уже доступны бенчмарки по медицине и сельскому хозяйству, которые помогут компаниям и экспертам выбрать и внедрить LLM, максимально соответствующие их бизнес-задачам.

В настоящий момент на сайте размещены три задачи, две из которых по сельскому хозяйству:

AgroBench: датасет, предназначенный для измерения профессиональных знаний модели, приобретенных в процессе предобучения в области агрономии. 2935 оригинальных вопросов по агрономии, охватывающих ботанику, кормопроизводство и луговодство, мелиоративное земледелие, общую генетику, общее земледелие, основы селекции, растениеводство, семеноводство и семеноведение, системы земледелия на различных агроландшафтах, технологии возделывания сельскохозяйственных культур.

AquaBench: датасет, предназначенный для измерения профессиональных знаний модели, приобретенных в процессе предобучения в области аквакультуры. 1102 задания по аквакультуре, включая индустриальную аквакультуру, кормление рыбы и гидробионтов, марикультуру (например, разведение раков, креветок, выращивание жемчуга), а также ихтиопатологию (ветеринария, профилактика и оптимизация технологий выращивания рыбы).

Датасеты являются полностью оригинальными и составлены на русском языке.

Одна задача по медицине, в которой охвачены 17 фундаментальных дисциплин — от клеточной биологии до клинических практик (хирургия, терапия, лабораторная диагностика, фармакология). Тест включает 270 вопросов и 30 тренировочных задач по каждой дисциплине, что позволяет LLM приблизиться к уровню выпускника медицинского вуза.

Бенчмарк MERA Industrial создан поддержке академического сообщества, в частности в проекте приняли участие Сколковский институт науки и технологий, Кубанский государственный аграрный университет, РАНХиГС, Нижегородский государственный архитектурно-строительный университет и другие. Ведущими экспертами тщательно формулируются задания, чтобы обеспечить:

•Достоверность информации на основе подтверждённых источников•Полное покрытие отраслевой таксономии•Разнообразие сложности и типов задач (от академических до практических кейсов)•Проверку всех ключевых навыков моделей•Оригинальность формулировок и отсутствие интернет-заимствований

 

MERA Industrial — это не только инструмент для оценки LLM, но и площадка дляформулирования новых задач и кейсов, валидации заданий, использования готовых бенчмарков для выбора и внедрения LLM в бизнес-процессы.

В условиях стремительного развития ИИ и LLM, отраслевые бенчмарки становятся ключевым инструментом для объективной оценки и внедрения моделей, способных решать реальные задачи бизнеса — от оптимизации производственных процессов до поддержки принятия решений и повышения качества обслуживания клиентов.

MERA Industrial — это новый стандарт прозрачности, достоверности и эффективности в выборе искусственного интеллекта для отраслей, где цена ошибки особенно высока.