Наука и технологии 17 17

Nashaniva.com

03.02.2025 / 13:01

«Последний экзамен человечества». Для нейросетей создали максимально сложный академический тест — и вот результат

Профессора, ученые, а также выдающиеся выпускники и студенты из почти 500 престижных образовательных учреждений по всему миру решили дать последний академический бой системам искусственного интеллекта, создав для них самый сложный из всех возможных тест экспертного уровня на рассуждение и владение техническими знаниями. Нейросети (в том числе ChatGPT и нашумевший китайский DeepSeek) приняли вызов и уже показали первые результаты.

Иллюстративное изображение. Фото: Vecteezy

Международная команда из 1000 экспертов в различных академических дисциплинах из почти 500 престижных образовательных учреждений (среди которых Оксфорд, Гарвард, Кембридж, Стэнфорд, швейцарский ETH, французская Inria и другие) разработали глобальный тест по техническим и передовым научным знаниям и логическому мышлению для измерения уровня совершенства систем искусственного интеллекта.

Тест получил название HLE (Humanity's Last Exam), или «Последний экзамен человечества». Эксперты назвали его самым сложным академическим испытанием в истории, которое можно создать для тестирования возможностей нейросетей в точных науках, не затрагивая аспект творческих способностей.

Экзамен HLE состоит из трех тысяч сложных вопросов по ста разным дисциплинам (например, классическая филология, химия, высшая математика, информатика, экология, лингвистика). Форматов заданий два: вопросы с точным совпадением (ИИ-модели сами пишут текст в качестве ответа) и вопросы с выбором ответа (ИИ выбирает один из пяти или более вариантов ответа). Особый акцент в тесте также делается на понимании схем и изображений.

Примеры вопросов по различным академическим дисциплинам в рамках экзамена HLE (на английском языке). Под вопросами указаны их авторы и образовательные учреждения, в которых те работают или обучаются. Источник: agi.safe.ai

В тесте уже приняли участие несколько топовых нейросетей, такие как ChatGPT (старые и новейшие версии), Claude (популярный у бизнесменов и программистов), Gemini (от корпорации Google), Grok (ИИ от Илона Маска) и DeepSeek (китайская нейросеть, которая обвалила весь технологический сектор США).

Все они с треском провалили экзамен (в плюс-минус 90% вопросов модели давали неправильный ответ, и еще настойчиво утверждали, что были правы), отметили авторы теста HLE.

Есть и показательный момент — худший и одновременно лучший результат продемонстрировал ChatGPT (его старая обычная версия Омни показала 3,3% точности ответов, средняя o1 показала результат 9,1, а новейшая o3-mini-high — 13). А нашумевший китайский DeepSeek, которого недавно назвали «убийцей ChatGPT», показал 9,4% точности ответов.

Результаты прохождения «Последнего экзамена человечества» (HLE) рядом топовых нейросетей. Все они с треском провалили тест (уровень правильности ответов составлял от 3 до 13 процентов), а лучший результат показала новая версия ChatGPT под названием o3-mini (high), которая вышла недавно. Источник: agi.safe.ai

Также показательно, что существующие сложные глобальные тесты на научные знания, такие как GPQA, MATH и MMLU, давались вышеупомянутым нейросетям намного легче, и те имели в них от 40 до почти 100 процентов правильных ответов.

Однако теперь с созданием теста HLE человечество бросило искусственному интеллекту очень серьезный вызов, который, как печально констатируют эксперты, может стать последним. По прогнозам авторов HLE, нейросети могут достичь в экзамене 50% точности ответов уже в конце этого года.

Сравнительные результаты точности ответов нескольких топовых нейросетей в существующих глобальных узкоспециализированных тестах GPQA, MATH и MMLU. С «Последним экзаменом человечества» (HLE) у систем искусственного интеллекта пока все плохо. Источник: agi.safe.ai

Читайте еще

Комментарии17

Жвір

03.02.2025

А может они и правы, они же машины, видят суть без искажений. Вот попросите ши нарисовать звёздное небо, уверен, что оно будет иным. Люди в основном много видят того, чего нет.
не такі, як ёсць

03.02.2025

Лічбавыя вынікі выпрабавання HLE паказваюць, што кітайскі ‘’забойца GPT” быў спісаны з сярэдняй о1 чата GPT
Хех

03.02.2025

Жвір ,
Трудно сказать, что они там видят.
Никто исчерпывающе не представляет ход рассуждений ИИ.

Управление и цензура в основном заключается в запрещении тех или иных действий, ответов, реакций.

Нецензурированный ИИ вполне может дать ответ "убить всех больных" на вопрос "как сделать всех здоровыми"
И разве ответ неправильный?

Сейчас читают

Названа средняя пенсия в Беларуси

К 105-летию Купаловского театра выпустили часы «Паўлінка»

«Правила изменились». В контролируемом Китаем греческом порту арестовали тысячи контейнеров с контрабандой

Белоруска сделала новый паспорт, а он оказался недействительным: Узнала об этом в аэропорту

Польша не откроет границу и после окончания учений «Запад»21 21

Сергей Тихановский остается во Флориде? Новый фейк конспирологов и пропагандистов8 8

Украинец и 17-летняя белоруска. Полиция Варшавы уточнила информацию о задержанных с дроном14 14

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует15 15

Топовую юристку из Минска осудили по «народной» 342-й статье6 6

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума18 18

Польша не откроет границу и после окончания учений «Запад»21

Общество21

Польша не откроет границу и после окончания учений «Запад»

Белоруска сделала новый паспорт, а он оказался недействительным: Узнала об этом в аэропорту

Сергей Тихановский остается во Флориде? Новый фейк конспирологов и пропагандистов8 8

Мужу Кати Андреевой, журналисту Игорю Ильяшу дали четыре года колонии3 3

Украинец и 17-летняя белоруска. Полиция Варшавы уточнила информацию о задержанных с дроном14 14

Сколько оставалось сидеть депортированным политзаключенным?13 13

Сколько оставалось сидеть депортированным политзаключенным?13

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует15 15

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует15

Топовую юристку из Минска осудили по «народной» 342-й статье6 6

Топовую юристку из Минска осудили по «народной» 342-й статье6

ДТП в Минской области: восемь человек госпитализированы

ДТП в Минской области: восемь человек госпитализированы

Как сейчас можно выехать и заехать в Евросоюз, когда польская граница закрыта?6 6

Как сейчас можно выехать и заехать в Евросоюз, когда польская граница закрыта?6

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума18 18

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума18

На границе с Польшей образовалась очередь из 1700 грузовиков1 1

На границе с Польшей образовалась очередь из 1700 грузовиков1

В Варшаве нейтрализовали дрон над правительственными зданиями. Задержаны два гражданина Беларуси32 32

В Варшаве нейтрализовали дрон над правительственными зданиями. Задержаны два гражданина Беларуси32

БелЖД объяснила, почему убрали «Штадлеры» с городских маршрутов8 8

БелЖД объяснила, почему убрали «Штадлеры» с городских маршрутов8

Жена Статкевича рассказала, о чем успела поговорить с ним21 21

Жена Статкевича рассказала, о чем успела поговорить с ним21

Сикорский встретился с Ван И в спецрезиденции Минобороны. По просьбе китайской стороны заявлений для прессы не было16 16

Сикорский встретился с Ван И в спецрезиденции Минобороны. По просьбе китайской стороны заявлений для прессы не было16

Кто та девушка, что сидела рядом с Лукашенко на конкурсе «Мисс Беларусь»? Раньше их не видели вместе20 20

Кто та девушка, что сидела рядом с Лукашенко на конкурсе «Мисс Беларусь»? Раньше их не видели вместе20

Штадлеры сняли с популярного маршрута Минск — Заславль17 17

Штадлеры сняли с популярного маршрута Минск — Заславль17

Светлана Тихановская летала на европейский форум на вертолете. А кто это оплачивал?29 29

Светлана Тихановская летала на европейский форум на вертолете. А кто это оплачивал?29

Саша Немо доказывает, что в 2020-м попал на протесты пьяным, после концертов в поддержку Лукашенко26 26

Саша Немо доказывает, что в 2020-м попал на протесты пьяным, после концертов в поддержку Лукашенко26

В Жлобинском районе двухметровый дрон упал в 30 метрах от школы3 3

В Жлобинском районе двухметровый дрон упал в 30 метрах от школы3

В Британии доктор проводил операцию, вышел, занялся сексом с медсестрой, вернулся и все доделал14 14

В Британии доктор проводил операцию, вышел, занялся сексом с медсестрой, вернулся и все доделал14

Виталий Бондарук: К Северинцу боялись подходить даже обычные зэки5 5

Виталий Бондарук: К Северинцу боялись подходить даже обычные зэки5

Боты получили новую методичку про Статкевича13 13

Боты получили новую методичку про Статкевича13

Лукашенко встречается с главой оккупационной администрации Херсонской области14 14

Лукашенко встречается с главой оккупационной администрации Херсонской области14

Все новости →

Сейчас читают

Названа средняя пенсия в Беларуси

К 105-летию Купаловского театра выпустили часы «Паўлінка»

«Правила изменились». В контролируемом Китаем греческом порту арестовали тысячи контейнеров с контрабандой

Белоруска сделала новый паспорт, а он оказался недействительным: Узнала об этом в аэропорту

Польша не откроет границу и после окончания учений «Запад»21

Сергей Тихановский остается во Флориде? Новый фейк конспирологов и пропагандистов8

Украинец и 17-летняя белоруска. Полиция Варшавы уточнила информацию о задержанных с дроном14

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует15

Топовую юристку из Минска осудили по «народной» 342-й статье6

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума18

Последние новости

Названа средняя пенсия в Беларуси

«Правила изменились». В контролируемом Китаем греческом порту арестовали тысячи контейнеров с контрабандой

В Ивьевском районе мужчина погиб, его намотало на карданный вал трактора

Сегодня в минской школе задымилось в столовой

Капитальный ремонт моста на Московской в Минске изменит некоторые маршруты трамваев

С 1 октября немного подорожает питание в школах и детских садах2

«Белавиа» полетит на Шри-Ланку1

Минобороны: На учениях «Запад-2025» отработаны все поставленные задачи4

Лукашенко: Беларусь не имеет отношения к дронам, которые залетают в Польшу или Литву6

К Минску приближаются ливни1

ФИФА объединила сентябрьскую и октябрьскую паузы на матчи сборных

Эксперты исследовали старые пушки2

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует15

Трамп может встретиться с Зеленским на следующей неделе

Доставка еды Rebox.by временно приостановила деятельность

Трамп подал иск на 15 миллиардов долларов против газеты The New York Times3

Ракетный удар по Запорожью: один погиб, 13 раненых

Топовую юристку из Минска осудили по «народной» 342-й статье6

Хренин полетел на учения в Россию

ДТП в Минской области: восемь человек госпитализированы

Переиздали роман «Мефисто» Клауса Манна в переводе Семухи

На чемпионате мира по легкой атлетике Кристина Тимановская побежит только в одной дисциплине1

Генконсульство Испании в Москве возобновило прием заявлений на визы

Одна из лидеров оппозиции Грузии задержана за надпись «Российская мечта» на предвыборном баннере правящей партии1

Археологи нашли в Смоленске княжеский терем XII века. Такие же находили в Полоцке и Гродно1

Все новости

«Хотел доказать, что буду жить, как хочу». Бывший политзаключенный Кучук рассказал, как боролся в тюрьме против «низкого статуса»3

МИД Польши о закрытии границы: Думаем в первую очередь о государственной безопасности, а не об экономической выгоде или затратах6

Жена Статкевича рассказала, о чем успела поговорить с ним21

Сикорский встретился с Ван И в спецрезиденции Минобороны. По просьбе китайской стороны заявлений для прессы не было16

Латвия пока не собирается закрывать границу с Беларусью2

В Минске значительно увеличат количество платных парковок2

Кто та девушка, что сидела рядом с Лукашенко на конкурсе «Мисс Беларусь»? Раньше их не видели вместе20

«Штрафы «физикам», а сельсоветы — «это другое». Люди возмутились, что госпредприятия не штрафуют за сорняки5

Светлана Тихановская летала на европейский форум на вертолете. А кто это оплачивал?29

Самое читаемое

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума

Жена Статкевича рассказала, о чем успела поговорить с ним

В Британии доктор проводил операцию, вышел, занялся сексом с медсестрой, вернулся и все доделал

Виталий Бондарук: К Северинцу боялись подходить даже обычные зэки

«Освобожденный» Статкевич нашелся в колонии Глубокого

«Поступило указание уничтожить морально окончательно». Первое большое интервью Николая Дедка после освобождения

Туск: В Польше нарастает волна пророссийских настроений

Позняк: Освободить псевдополитических заложников реально

больш чытаных навін

Самое лайканое

«Поступило указание уничтожить морально окончательно». Первое большое интервью Николая Дедка после освобождения

Зеленский пригрозил ударами по порту на Балтике, где заправляются нефтяные танкеры России

«Так это освобождение или новая пытка? Обман!» Алексиевич прокомментировала депортацию 52 политзаключенных и поступок Статкевича

Нейросети творят чудеса с историческим наследием Беларуси МНОГО ФОТО

Это не освобождение, а депортация. Дулина ответила Рудковскому

«Представляю ярость Лукашенко от поступка Николая Статкевича»

Где Николай Статкевич? С границы его забрали неизвестные в масках. Что известно на данный момент

Белорусский журналист призвал бить артиллерией по Дроздам, а не торговаться

больш лайканых навін

Опрос

«Последний экзамен человечества». Для нейросетей создали максимально сложный академический тест — и вот результат

Скоро программисты станут не нужны, их заменит искусственный интеллект — глава NVIDIA

В следующие 10 лет ученые надеются победить бесплодие. Но эта технология несет и новые риски

Самый богатый спецслужбист планеты решил стать лидером новой технологической революции

Комментарии17

Сейчас читают

Названа средняя пенсия в Беларуси

К 105-летию Купаловского театра выпустили часы «Паўлінка»

«Правила изменились». В контролируемом Китаем греческом порту арестовали тысячи контейнеров с контрабандой

Белоруска сделала новый паспорт, а он оказался недействительным: Узнала об этом в аэропорту

Польша не откроет границу и после окончания учений «Запад»2121

Сергей Тихановский остается во Флориде? Новый фейк конспирологов и пропагандистов88

Украинец и 17-летняя белоруска. Полиция Варшавы уточнила информацию о задержанных с дроном1414

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует1515

Топовую юристку из Минска осудили по «народной» 342-й статье66

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума1818

Польша не откроет границу и после окончания учений «Запад»21

Польша не откроет границу и после окончания учений «Запад»

Белоруска сделала новый паспорт, а он оказался недействительным: Узнала об этом в аэропорту

Сергей Тихановский остается во Флориде? Новый фейк конспирологов и пропагандистов88

Мужу Кати Андреевой, журналисту Игорю Ильяшу дали четыре года колонии33

Украинец и 17-летняя белоруска. Полиция Варшавы уточнила информацию о задержанных с дроном1414

Сколько оставалось сидеть депортированным политзаключенным?1313

Сколько оставалось сидеть депортированным политзаключенным?13

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует1515

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует15

Топовую юристку из Минска осудили по «народной» 342-й статье66

Топовую юристку из Минска осудили по «народной» 342-й статье6

ДТП в Минской области: восемь человек госпитализированы

ДТП в Минской области: восемь человек госпитализированы

Как сейчас можно выехать и заехать в Евросоюз, когда польская граница закрыта?66

Как сейчас можно выехать и заехать в Евросоюз, когда польская граница закрыта?6

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума1818

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума18

На границе с Польшей образовалась очередь из 1700 грузовиков11

На границе с Польшей образовалась очередь из 1700 грузовиков1

В Варшаве нейтрализовали дрон над правительственными зданиями. Задержаны два гражданина Беларуси3232

В Варшаве нейтрализовали дрон над правительственными зданиями. Задержаны два гражданина Беларуси32

БелЖД объяснила, почему убрали «Штадлеры» с городских маршрутов88

БелЖД объяснила, почему убрали «Штадлеры» с городских маршрутов8

Жена Статкевича рассказала, о чем успела поговорить с ним2121

Жена Статкевича рассказала, о чем успела поговорить с ним21

Сикорский встретился с Ван И в спецрезиденции Минобороны. По просьбе китайской стороны заявлений для прессы не было1616

Сикорский встретился с Ван И в спецрезиденции Минобороны. По просьбе китайской стороны заявлений для прессы не было16

Кто та девушка, что сидела рядом с Лукашенко на конкурсе «Мисс Беларусь»? Раньше их не видели вместе2020

Кто та девушка, что сидела рядом с Лукашенко на конкурсе «Мисс Беларусь»? Раньше их не видели вместе20

Штадлеры сняли с популярного маршрута Минск — Заславль1717

Штадлеры сняли с популярного маршрута Минск — Заславль17

Светлана Тихановская летала на европейский форум на вертолете. А кто это оплачивал?2929

Светлана Тихановская летала на европейский форум на вертолете. А кто это оплачивал?29

Саша Немо доказывает, что в 2020-м попал на протесты пьяным, после концертов в поддержку Лукашенко2626

Саша Немо доказывает, что в 2020-м попал на протесты пьяным, после концертов в поддержку Лукашенко26

В Жлобинском районе двухметровый дрон упал в 30 метрах от школы33

В Жлобинском районе двухметровый дрон упал в 30 метрах от школы3

В Британии доктор проводил операцию, вышел, занялся сексом с медсестрой, вернулся и все доделал1414

В Британии доктор проводил операцию, вышел, занялся сексом с медсестрой, вернулся и все доделал14

Виталий Бондарук: К Северинцу боялись подходить даже обычные зэки55

Виталий Бондарук: К Северинцу боялись подходить даже обычные зэки5

Боты получили новую методичку про Статкевича1313

Боты получили новую методичку про Статкевича13

Лукашенко встречается с главой оккупационной администрации Херсонской области1414

Лукашенко встречается с главой оккупационной администрации Херсонской области14

Названа средняя пенсия в Беларуси

К 105-летию Купаловского театра выпустили часы «Паўлінка»

«Правила изменились». В контролируемом Китаем греческом порту арестовали тысячи контейнеров с контрабандой

Белоруска сделала новый паспорт, а он оказался недействительным: Узнала об этом в аэропорту

Польша не откроет границу и после окончания учений «Запад»21

Сергей Тихановский остается во Флориде? Новый фейк конспирологов и пропагандистов8

Украинец и 17-летняя белоруска. Полиция Варшавы уточнила информацию о задержанных с дроном14

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует15

Топовую юристку из Минска осудили по «народной» 342-й статье6

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума18

Названа средняя пенсия в Беларуси

«Правила изменились». В контролируемом Китаем греческом порту арестовали тысячи контейнеров с контрабандой

В Ивьевском районе мужчина погиб, его намотало на карданный вал трактора

Сегодня в минской школе задымилось в столовой

Капитальный ремонт моста на Московской в Минске изменит некоторые маршруты трамваев

С 1 октября немного подорожает питание в школах и детских садах2

«Белавиа» полетит на Шри-Ланку1

Минобороны: На учениях «Запад-2025» отработаны все поставленные задачи4

Польша не откроет границу и после окончания учений «Запад»21 21

Сергей Тихановский остается во Флориде? Новый фейк конспирологов и пропагандистов8 8

Украинец и 17-летняя белоруска. Полиция Варшавы уточнила информацию о задержанных с дроном14 14

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует15 15

Топовую юристку из Минска осудили по «народной» 342-й статье6 6

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума18 18

Сергей Тихановский остается во Флориде? Новый фейк конспирологов и пропагандистов8 8

Мужу Кати Андреевой, журналисту Игорю Ильяшу дали четыре года колонии3 3

Украинец и 17-летняя белоруска. Полиция Варшавы уточнила информацию о задержанных с дроном14 14

Сколько оставалось сидеть депортированным политзаключенным?13 13

Алла Пугачёва высоко отозвалась о Джохаре Дудаеве. Кадыров бушует15 15

Топовую юристку из Минска осудили по «народной» 342-й статье6 6

Как сейчас можно выехать и заехать в Евросоюз, когда польская граница закрыта?6 6

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума18 18

На границе с Польшей образовалась очередь из 1700 грузовиков1 1

В Варшаве нейтрализовали дрон над правительственными зданиями. Задержаны два гражданина Беларуси32 32

БелЖД объяснила, почему убрали «Штадлеры» с городских маршрутов8 8

Жена Статкевича рассказала, о чем успела поговорить с ним21 21

Сикорский встретился с Ван И в спецрезиденции Минобороны. По просьбе китайской стороны заявлений для прессы не было16 16

Кто та девушка, что сидела рядом с Лукашенко на конкурсе «Мисс Беларусь»? Раньше их не видели вместе20 20

Штадлеры сняли с популярного маршрута Минск — Заславль17 17

Светлана Тихановская летала на европейский форум на вертолете. А кто это оплачивал?29 29

Саша Немо доказывает, что в 2020-м попал на протесты пьяным, после концертов в поддержку Лукашенко26 26

В Жлобинском районе двухметровый дрон упал в 30 метрах от школы3 3

В Британии доктор проводил операцию, вышел, занялся сексом с медсестрой, вернулся и все доделал14 14

Виталий Бондарук: К Северинцу боялись подходить даже обычные зэки5 5

Боты получили новую методичку про Статкевича13 13

Лукашенко встречается с главой оккупационной администрации Херсонской области14 14

Сергей Тихановский остается во Флориде? Новый фейк конспирологов и пропагандистов8 8

Мужу Кати Андреевой, журналисту Игорю Ильяшу дали четыре года колонии3 3

Как сейчас можно выехать и заехать в Евросоюз, когда польская граница закрыта?6 6

Помните минчанина, который вместе с матерью пропустил тело убитой девушки через мясорубку? Дедок говорит, что он в тюрьме сошел с ума18 18

На границе с Польшей образовалась очередь из 1700 грузовиков1 1

В Варшаве нейтрализовали дрон над правительственными зданиями. Задержаны два гражданина Беларуси32 32

Глава оккупированной Херсонщины написал о поставках из Беларуси медтехники, но проиллюстрировал это странно3 3

БелЖД объяснила, почему убрали «Штадлеры» с городских маршрутов8 8

В Минске владелец исторического здания довел его до ручки3 3