home.social

#o4mini — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #o4mini, aggregated by home.social.

  1. OpenAI’s o3: The Reasoning Engine Redefining AI for Coders, Scientists and Enterprises OpenAI's o3 model, released April 2025, masters visual reasoning, tool use, and tough benchmarks in code...

    #SupplyChainPro #AI #Agents #AIME #math #ChatGPT #tools #o4-mini #OpenAI #o3 #reasoning

    Origin | Interest | Match
  2. After playing #LumoAI by #Proton in #chess, I decided to try #o4mini by #OpenAI. The result was fairly similar. Very strong opening followed by inexplicably dropping its knight and queen in the middle game. At one point it even argued back after I told it one of the moves was illegal. Wrong but confident, not a very good combination of traits.

    #lichess #AI

  3. After playing by in , I decided to try by . The result was fairly similar. Very strong opening followed by inexplicably dropping its knight and queen in the middle game. At one point it even argued back after I told it one of the moves was illegal. Wrong but confident, not a very good combination of traits.

  4. After playing #LumoAI by #Proton in #chess, I decided to try #o4mini by #OpenAI. The result was fairly similar. Very strong opening followed by inexplicably dropping its knight and queen in the middle game. At one point it even argued back after I told it one of the moves was illegal. Wrong but confident, not a very good combination of traits.

    #lichess #AI

  5. After playing #LumoAI by #Proton in #chess, I decided to try #o4mini by #OpenAI. The result was fairly similar. Very strong opening followed by inexplicably dropping its knight and queen in the middle game. At one point it even argued back after I told it one of the moves was illegal. Wrong but confident, not a very good combination of traits.

    #lichess #AI

  6. Freie Nutzung dank #Apache-2.0-Lizenz 📜 Beide Modelle dürfen angepasst, kommerziell genutzt und über Plattformen wie Hugging Face oder AWS bezogen werden.

    Reaktion auf #OpenSource-Trend 📈 Nach Kritik und Konkurrenzdruck setzt #OpenAI nun auch auf #offeneModelle, die ähnlich leistungsfähig wie #o3mini oder #o4mini sind.

    👉 eicker.TV#Technik #Medien #Politik #Wirtschafteicker.BE/ratung von Gerrit Eicker aus Münster (2/2)

  7. Freie Nutzung dank #Apache-2.0-Lizenz 📜 Beide Modelle dürfen angepasst, kommerziell genutzt und über Plattformen wie Hugging Face oder AWS bezogen werden.

    Reaktion auf #OpenSource-Trend 📈 Nach Kritik und Konkurrenzdruck setzt #OpenAI nun auch auf #offeneModelle, die ähnlich leistungsfähig wie #o3mini oder #o4mini sind.

    👉 eicker.TV#Technik #Medien #Politik #Wirtschafteicker.BE/ratung von Gerrit Eicker aus Münster (2/2)

  8. Freie Nutzung dank #Apache-2.0-Lizenz 📜 Beide Modelle dürfen angepasst, kommerziell genutzt und über Plattformen wie Hugging Face oder AWS bezogen werden.

    Reaktion auf #OpenSource-Trend 📈 Nach Kritik und Konkurrenzdruck setzt #OpenAI nun auch auf #offeneModelle, die ähnlich leistungsfähig wie #o3mini oder #o4mini sind.

    👉 eicker.TV#Technik #Medien #Politik #Wirtschafteicker.BE/ratung von Gerrit Eicker aus Münster (2/2)

  9. Les 17 et 18 mai 2025, l’ #IA #AI #o4-mini a résolu des énigmes uniques. Le #monde #scientifique n’en revient toujours pas : sur 40 énigmes, 30 résolues en direct. Des chercheurs de #Caltech, #Oxford et #Cambridge ont bivouaqué à #Berkeley durant 2j dailygeekshow.com/gpt-5-arrive...

    « GPT-5 arrive demain » : plus...

  10. [Перевод] Тестируем особенности искусственного интеллекта: o3, GPT-4.1 и o4-mini

    Искусственный интеллект в последнее время постоянно радует нас разными новостями и новыми моделями. Команда VK Tech перевела статью со сравнением трех новых моделей — это поможет понять, какую же использовать для каких задач и чем модели по-настоящему отличаются друг от друга. Дальше передаем слово авторам оригинальной статьи.

    habr.com/ru/companies/vktech/a

    #vk_cloud #ии #o3 #gpt41 #o4mini #openai #gpt

  11. [Перевод] Тестируем особенности искусственного интеллекта: o3, GPT-4.1 и o4-mini

    Искусственный интеллект в последнее время постоянно радует нас разными новостями и новыми моделями. Команда VK Tech перевела статью со сравнением трех новых моделей — это поможет понять, какую же использовать для каких задач и чем модели по-настоящему отличаются друг от друга. Дальше передаем слово авторам оригинальной статьи.

    habr.com/ru/companies/vktech/a

    #vk_cloud #ии #o3 #gpt41 #o4mini #openai #gpt

  12. [Перевод] Тестируем особенности искусственного интеллекта: o3, GPT-4.1 и o4-mini

    Искусственный интеллект в последнее время постоянно радует нас разными новостями и новыми моделями. Команда VK Tech перевела статью со сравнением трех новых моделей — это поможет понять, какую же использовать для каких задач и чем модели по-настоящему отличаются друг от друга. Дальше передаем слово авторам оригинальной статьи.

    habr.com/ru/companies/vktech/a

    #vk_cloud #ии #o3 #gpt41 #o4mini #openai #gpt

  13. [Перевод] Тестируем особенности искусственного интеллекта: o3, GPT-4.1 и o4-mini

    Искусственный интеллект в последнее время постоянно радует нас разными новостями и новыми моделями. Команда VK Tech перевела статью со сравнением трех новых моделей — это поможет понять, какую же использовать для каких задач и чем модели по-настоящему отличаются друг от друга. Дальше передаем слово авторам оригинальной статьи.

    habr.com/ru/companies/vktech/a

    #vk_cloud #ии #o3 #gpt41 #o4mini #openai #gpt

  14. 🤖 AI
    🔴 ChatGPT Adds ‘Lightweight’ Research Mode

    🔸 New o4-mini-powered version offers deep replies in shorter form.
    🔸 Free users now get 5 monthly tasks; Plus & Team get 25, Pro 250.
    🔸 Kicks in automatically when paid users hit deep research limits.
    🔸 Much cheaper to run—key as OpenAI handles huge prompt volumes.

    #ChatGPT #AI #OpenAI #DeepResearch #o4mini #Tech

  15. 🤖 AI
    🔴 ChatGPT Adds ‘Lightweight’ Research Mode

    🔸 New o4-mini-powered version offers deep replies in shorter form.
    🔸 Free users now get 5 monthly tasks; Plus & Team get 25, Pro 250.
    🔸 Kicks in automatically when paid users hit deep research limits.
    🔸 Much cheaper to run—key as OpenAI handles huge prompt volumes.

    #ChatGPT #AI #OpenAI #DeepResearch #o4mini #Tech

  16. 🤖 AI
    🔴 ChatGPT Adds ‘Lightweight’ Research Mode

    🔸 New o4-mini-powered version offers deep replies in shorter form.
    🔸 Free users now get 5 monthly tasks; Plus & Team get 25, Pro 250.
    🔸 Kicks in automatically when paid users hit deep research limits.
    🔸 Much cheaper to run—key as OpenAI handles huge prompt volumes.

    #ChatGPT #AI #OpenAI #DeepResearch #o4mini #Tech

  17. "For the past two and a half years the feature I’ve most wanted from LLMs is the ability to take on search-based research tasks on my behalf. We saw the first glimpses of this back in early 2023, with Perplexity (first launched December 2022, first prompt leak in January 2023) and then the GPT-4 powered Microsoft Bing (which launched/cratered spectacularly in February 2023). Since then a whole bunch of people have taken a swing at this problem, most notably Google Gemini and ChatGPT Search.

    Those 2023-era versions were promising but very disappointing. They had a strong tendency to hallucinate details that weren’t present in the search results, to the point that you couldn’t trust anything they told you.

    In this first half of 2025 I think these systems have finally crossed the line into being genuinely useful."

    simonwillison.net/2025/Apr/21/

    #AI #GenerativeAI #Search #AISearch #DeepResearch #o3 #o4mini #OpenAI #Google #Gemini #LLMs #Chatbots

  18. "For the past two and a half years the feature I’ve most wanted from LLMs is the ability to take on search-based research tasks on my behalf. We saw the first glimpses of this back in early 2023, with Perplexity (first launched December 2022, first prompt leak in January 2023) and then the GPT-4 powered Microsoft Bing (which launched/cratered spectacularly in February 2023). Since then a whole bunch of people have taken a swing at this problem, most notably Google Gemini and ChatGPT Search.

    Those 2023-era versions were promising but very disappointing. They had a strong tendency to hallucinate details that weren’t present in the search results, to the point that you couldn’t trust anything they told you.

    In this first half of 2025 I think these systems have finally crossed the line into being genuinely useful."

    simonwillison.net/2025/Apr/21/

    #AI #GenerativeAI #Search #AISearch #DeepResearch #o3 #o4mini #OpenAI #Google #Gemini #LLMs #Chatbots

  19. "For the past two and a half years the feature I’ve most wanted from LLMs is the ability to take on search-based research tasks on my behalf. We saw the first glimpses of this back in early 2023, with Perplexity (first launched December 2022, first prompt leak in January 2023) and then the GPT-4 powered Microsoft Bing (which launched/cratered spectacularly in February 2023). Since then a whole bunch of people have taken a swing at this problem, most notably Google Gemini and ChatGPT Search.

    Those 2023-era versions were promising but very disappointing. They had a strong tendency to hallucinate details that weren’t present in the search results, to the point that you couldn’t trust anything they told you.

    In this first half of 2025 I think these systems have finally crossed the line into being genuinely useful."

    simonwillison.net/2025/Apr/21/

    #AI #GenerativeAI #Search #AISearch #DeepResearch #o3 #o4mini #OpenAI #Google #Gemini #LLMs #Chatbots

  20. "For the past two and a half years the feature I’ve most wanted from LLMs is the ability to take on search-based research tasks on my behalf. We saw the first glimpses of this back in early 2023, with Perplexity (first launched December 2022, first prompt leak in January 2023) and then the GPT-4 powered Microsoft Bing (which launched/cratered spectacularly in February 2023). Since then a whole bunch of people have taken a swing at this problem, most notably Google Gemini and ChatGPT Search.

    Those 2023-era versions were promising but very disappointing. They had a strong tendency to hallucinate details that weren’t present in the search results, to the point that you couldn’t trust anything they told you.

    In this first half of 2025 I think these systems have finally crossed the line into being genuinely useful."

    simonwillison.net/2025/Apr/21/

    #AI #GenerativeAI #Search #AISearch #DeepResearch #o3 #o4mini #OpenAI #Google #Gemini #LLMs #Chatbots

  21. "For the past two and a half years the feature I’ve most wanted from LLMs is the ability to take on search-based research tasks on my behalf. We saw the first glimpses of this back in early 2023, with Perplexity (first launched December 2022, first prompt leak in January 2023) and then the GPT-4 powered Microsoft Bing (which launched/cratered spectacularly in February 2023). Since then a whole bunch of people have taken a swing at this problem, most notably Google Gemini and ChatGPT Search.

    Those 2023-era versions were promising but very disappointing. They had a strong tendency to hallucinate details that weren’t present in the search results, to the point that you couldn’t trust anything they told you.

    In this first half of 2025 I think these systems have finally crossed the line into being genuinely useful."

    simonwillison.net/2025/Apr/21/

    #AI #GenerativeAI #Search #AISearch #DeepResearch #o3 #o4mini #OpenAI #Google #Gemini #LLMs #Chatbots

  22. [Перевод] GPT наконец перестал выдумывать факты и действительно понимает, что находит в интернете?

    Поисковые возможности языковых моделей наконец перешли от многообещающих демонстраций к реально полезным инструментам. Новые модели o3, o4-mini от OpenAI и обновленный Gemini 2.5 Pro научились выполнять поиск как часть процесса рассуждений перед формированием ответа, что практически исключает галлюцинации. Эти системы могут за считанные секунды проводить исследования, на которые раньше уходили часы работы человека.

    habr.com/ru/articles/903082/

    #искусственный_интеллект #поиск #o3 #o4mini #chatgpt #gemini #deep_research #google

  23. [Перевод] GPT наконец перестал выдумывать факты и действительно понимает, что находит в интернете?

    Поисковые возможности языковых моделей наконец перешли от многообещающих демонстраций к реально полезным инструментам. Новые модели o3, o4-mini от OpenAI и обновленный Gemini 2.5 Pro научились выполнять поиск как часть процесса рассуждений перед формированием ответа, что практически исключает галлюцинации. Эти системы могут за считанные секунды проводить исследования, на которые раньше уходили часы работы человека.

    habr.com/ru/articles/903082/

    #искусственный_интеллект #поиск #o3 #o4mini #chatgpt #gemini #deep_research #google

  24. [Перевод] GPT наконец перестал выдумывать факты и действительно понимает, что находит в интернете?

    Поисковые возможности языковых моделей наконец перешли от многообещающих демонстраций к реально полезным инструментам. Новые модели o3, o4-mini от OpenAI и обновленный Gemini 2.5 Pro научились выполнять поиск как часть процесса рассуждений перед формированием ответа, что практически исключает галлюцинации. Эти системы могут за считанные секунды проводить исследования, на которые раньше уходили часы работы человека.

    habr.com/ru/articles/903082/

    #искусственный_интеллект #поиск #o3 #o4mini #chatgpt #gemini #deep_research #google

  25. [Перевод] GPT наконец перестал выдумывать факты и действительно понимает, что находит в интернете?

    Поисковые возможности языковых моделей наконец перешли от многообещающих демонстраций к реально полезным инструментам. Новые модели o3, o4-mini от OpenAI и обновленный Gemini 2.5 Pro научились выполнять поиск как часть процесса рассуждений перед формированием ответа, что практически исключает галлюцинации. Эти системы могут за считанные секунды проводить исследования, на которые раньше уходили часы работы человека.

    habr.com/ru/articles/903082/

    #искусственный_интеллект #поиск #o3 #o4mini #chatgpt #gemini #deep_research #google