Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. На аукцион выставили ТЦ известного бизнесмена, который признан политзаключенным. Его задержали в аэропорту после возвращения в Беларусь
  2. «Отвечали, что все замечательно». Что не так с мотодельтапланом, который разбился под Минском и унес жизни двух человек
  3. Офис студии ZROBIM architects работает. Узнали, что интересовало силовиков
  4. Лукашенко подписал закон, который вводит ответственность за «ряд новых правонарушений»
  5. Власти попросили внести изменения для водителей
  6. «Сенсационные результаты». Эксперты рассказали, кто контролирует рынок новых автомобилей в Беларуси
  7. «Она была спортивной девушкой». Что известно о погибшей пассажирке упавшего дельтаплана
  8. «Опасная эскалация». В ООН призвали Беларусь приостановить введение в действие подписанного накануне Лукашенко закона
  9. «Будете картошку перебирать, его позовите!» Экс-министр внутренних дел Караев проинспектировал фермы — получилась пародия на Лукашенко
  10. Цены на эти квартиры в Минске улетают в космос — эксперты рассказали подробности
  11. Синоптики рассказали, когда придет похолодание
  12. На валютном рынке зафиксировали ситуацию, которой не было почти три года. Что происходит в обменниках


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.