#gpt_35turbo — Public Fediverse posts on home.social

Habr @[email protected] · 2024-11-29 · 11:32 UTC

[Перевод] Почему LLM так плохо играют в шахматы (и что с этим делать)

В своём последнем посте я говорил об одной загадке : все большие языковые модели (LLM) ужасно играют в шахматы. Все, за исключением gpt-3.5-turbo-instruct , которая по какой-то причине умеет играть на уровне продвинутого любителя. И это несмотря на то, что этой модели больше года и она намного меньше новых моделей. Что происходит? Я предложил четыре возможных объяснения: Теория 1: достаточно большие базовые модели хороши в шахматах, но это свойство не сохраняется после их подстройки под чат-модели. Теория 2 : по какой-то причине gpt-3.5-turbo-instruct обучали на большем объёме шахматных данных. Теория 3: в некоторых архитектурах LLM есть нечто магическое. Теория 4: существует «конкуренция» между разными типами данных, поэтому чтобы LLM могла хорошо играть в шахматы, большая доля данных должна быть информацией о шахматных партиях. В Интернете нашлось ещё множество других теорий. Самые распространённые из них: Теория 5 : OpenAI жульничает. Теория 6 : на самом деле LLM не могут играть в шахматы. Я провёл новые эксперименты. Хорошие новости — ошибались все! В этом посте я покажу, что новые чат-модели достаточно хорошо могут играть в шахматы, если вы готовы зайти достаточно далеко, чтобы разобраться в составлении промтов. А затем я изложу свою теорию о происходящем.

https://habr.com/ru/articles/862070/

#шахматы #llm #большие_языковые_модели #gpt_35turbo #gpt_40 #gpt4o #gpt4_omni #llama #llama_31

#llama_31 #llama #gpt4_omni #gpt4o #gpt_40 #gpt_35turbo

Habr @[email protected] · 2024-05-13 · 11:52 UTC

Почему новая модель GPT-3,5 Turbo говорит, что ее создали в российской компании Just AI?

И можно ли верить, что данные клиентов OpenAI отправленные через API, не используются для обучения моделей? На днях наши знакомые ребята спросили бота на GPT-3,5 Turbo о том, кто его создал. Ответ был: «Я был создан командой Just AI». То есть нами. Хотелось ответить, что команда Just AI тайно правит миром и стоит за большими языковыми моделями. На самом деле мы очень удивились и решили разобраться, как так получилось. В этой статье расскажем о нашем мини-расследовании и гипотезах, попутно рассказав и об инструментах, которые мы для этого использовали.

https://habr.com/ru/companies/just_ai/articles/813911/

#искусственный_интеллект #ии #openai #нейросети #обучение_ии #chatgpt #chatgpt_api #gpt_35turbo

#gpt_35turbo #chatgpt_api #chatgpt #обучение_ии #нейросети #openai

Habr @[email protected] · 2024-02-18 · 19:22 UTC

Как включить Dall-e, поиск bing, Wolfram, и другие модули в GPT 3.5 turbo, и почему это гиблая затея

Бессмысленный, беспощадный и смешной гайд, задача которого не столько показать, что это возможно. Сколько указать на то, что это не нужно. Итак, как подключить Dall-e к ChatGPT 3.5 TURBO. Много картинок. Потому что не знал, как проиллюстрировать процесс в динамике. Прошу прощения. Смотреть смешные картинки 🗿

https://habr.com/ru/articles/794552/

#dalle_3 #GPT_35 #gpt_35turbo

#gpt_35turbo #gpt_35 #dalle_3