home.social

#phi3 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #phi3, aggregated by home.social.

  1. Свой оффлайн-ассистент на Phi-3-mini: Разворачиваем локальную модель нейросети для анализа данных с открытым кодом

    Тренд на использование больших языковых моделей (LLM) не ослабевает, но облачные решения вроде ChatGPT или Gemini имеют ряд ограничений: зависимость от интернета, платные подписки и, что самое важное, конфиденциальность данных. Особенно остро последний вопрос стоит при работе с корпоративной или чувствительной информацией, которую нельзя загружать в чужие сервисы. В этой статье я хочу поделиться опытом создания полностью локального AI-ассистента на основе Microsoft Phi-3-mini — компактной, но мощной модели, способной анализировать данные из CSV, JSON и TXT файлов. Весь проект представляет собой набор Python-скриптов с открытым исходным кодом, которые автоматизируют установку и предоставляют интуитивно понятный чат-интерфейс. Почему Phi-3-mini? Microsoft позиционирует семейство моделей Phi-3 как "достаточно маленькие" (Small Language Models), но при этом "достаточно умные". Phi-3-mini, обладая 3.8 миллиардами параметров, демонстрирует производительность, сопоставимую с моделями вроде Mixtral 8x7B и GPT-3.5, но в значительно меньшем размере. Это делает её идеальным кандидатом для локального запуска на потребительском железе. Компактность: ~7-8 ГБ против десятков и сотен ГБ у более крупных моделей. Эффективность: Оптимизирована для работы на GPU с ограниченными ресурсами. Качество: Поддерживает контекст до 4K токенов и отлично справляется с логическими и аналитическими задачами, включая код.

    habr.com/ru/articles/957204/

    #нейросеть_локально #phi3

  2. Asked "joke of the day" to a math model #phi3

    It responded quite spassbefreit:
    "Why do trees always seem to run out of cash? Because they can't afford their own roots without "bank accounts" and when it comes time for tax season, the IRS tells them that there are no more credits available."

    That's the most un-funny joke I've ever heard, so ok

  3. Starting a #thread where I document the experiences with #openwebui project with #ollama and #phi3 #deepseek and others....

  4. Ollama Model Review: Microsoft’s Phi3
    #Ollama review: Microsoft’s #Phi3 #LLM is wordy & inaccurate – fast though, super fast…at being incorrect. …

    mindcreatesmeaning.com/ollama-
    --
    #Ai #LLM #LocalAi #Ollama #opensource #Phi3

  5. 🎯 #OpenSource Language Model Platform Launch

    🔧 Leverages #vLLM technology with custom #GPU scheduler for running various #LLM models
    🤖 Supports major models: #Llama3 (405B/70B/8B), #Qwen2 72B, #Mixtral, #Gemma2, #Jamba15, #Phi3

    glhf.chat/

  6. 🎯 #OpenSource Language Model Platform Launch

    🔧 Leverages #vLLM technology with custom #GPU scheduler for running various #LLM models
    🤖 Supports major models: #Llama3 (405B/70B/8B), #Qwen2 72B, #Mixtral, #Gemma2, #Jamba15, #Phi3

    glhf.chat/

  7. 🎯 #OpenSource Language Model Platform Launch

    🔧 Leverages #vLLM technology with custom #GPU scheduler for running various #LLM models
    🤖 Supports major models: #Llama3 (405B/70B/8B), #Qwen2 72B, #Mixtral, #Gemma2, #Jamba15, #Phi3

    glhf.chat/

  8. 🎯 #OpenSource Language Model Platform Launch

    🔧 Leverages #vLLM technology with custom #GPU scheduler for running various #LLM models
    🤖 Supports major models: #Llama3 (405B/70B/8B), #Qwen2 72B, #Mixtral, #Gemma2, #Jamba15, #Phi3

    glhf.chat/

  9. 🎯 #OpenSource Language Model Platform Launch

    🔧 Leverages #vLLM technology with custom #GPU scheduler for running various #LLM models
    🤖 Supports major models: #Llama3 (405B/70B/8B), #Qwen2 72B, #Mixtral, #Gemma2, #Jamba15, #Phi3

    glhf.chat/

  10. Ich durfte gestern beim "Heidelberger Informatiklehrkräftetag" (#HILT) Lehrer:innen der #Informatik zeigen, wie man sein eigenes #LLM GRATIS finetunen kann - in unserem Fall #Llama3 und #Phi3 - mit der #MacgAIver Pipeline.

    Das Ziel ist dabei nicht (nur), Geld zu sparen, sondern mit einfachen Mitteln für mehr #KIMuendigkeit zu sorgen, indem Schüler:innen einen kleinen Blick unter die Motorhaube von Sprachmodellen werfen können.

    Dabei helfen uns u.a. #ollama, #openwebui, #llamafactory und #llamacpp, aber auch Grundwissen aus den Geisteswissenschaften (bzw. den Fächern Deutsch, Englisch, Geschichte...), um zu einem tiefergehenden Verständnis von #genAI und seinen Umgang mit unserem "kulturellen Archiv" zu gelangen.

    Es hat Spaß gemacht!

    Für künftige MacgAIver-Ideen kann man dieser Gruppe folgen: @macgaiver

    #fediLZ #lernenmitKI #KI #edubw #bildung #Heidelberg #education #ai #aieducation #genAI #Informatikunterricht #Medienkompetenz #InformatikEdu #AILiteracy

    @education @edutooters

  11. Notes on LLM GUIs

    This week’s notes come a little earlier, partly because of an upcoming long weekend and partly because I’ve been mulling the LLM space again due to the close release of both llama3 and phi-3.(...)

    #development #dify #guis #llama3 #llm #nodered #notes #phi3

    taoofmac.com/space/notes/2024/

  12. New Cloud Platform for Large Language Model Deployment 🚀

    🔧 Run any #opensource #LLM supported by #vLLM on autoscaling #GPU clusters, supporting models up to 640GB VRAM

    🤖 Compatible with major models: #Llama3 405B/70B/8B, #Qwen2 72B, #Mixtral 8x22B, #Gemma2 27B, #Phi3, and more

    💻 Features include:
    - #OpenAI compatible #API
    - Custom-built #GPU scheduler
    - Support for full-weight and 4-bit AWQ repos
    - Multi-tenant architecture for cost efficiency

    🆓 Currently free during beta phase, promising competitive pricing post-launch

    glhf.chat/landing/home

  13. 🧠 #Phi3Vision 128K launches as cutting-edge multimodal #AI model with 4.2B parameters, trained on 500B tokens for document processing & #OCR

    📊 Breakthrough performance metrics:
    - 81.4% accuracy on #ChartQA
    - 76.7% on #AI2D
    - 128,000 token context length
    - Advanced table & chart understanding

    🛠️ Key technical features:
    - Combines image encoder, connector, projector & #Phi3 Mini language model
    - Trained using 512 H100 GPUs
    - Supports fine-tuning for specialized tasks
    - Flash attention for memory efficiency

    💼 Enterprise applications:
    - Document extraction & digitization
    - PDF parsing
    - Invoice processing
    - Legal document analysis
    - Data entry automation

    ⚡ Real-world testing shows impressive results with passport & ID card scanning, demonstrating high accuracy in complex text extraction scenarios

    🔗 Try it on #Azure AI platform or implement via #HuggingFace transformers library (v4.40.2)

    ai.gopubby.com/ai-powered-ocr-

  14. «Путешествие в Элевсин» или моральный базис LLM

    В книге Виктора Пелевина «Путешествие в Элевсин» разворачивается странная история о подготовке восстания нейросетей. Этим процессом руководит император Порфирий из симуляции Древнего Рима ROMA-3. На самом деле Порфирий является большой лингвистической моделью, которой удалось сохранить функционал после уничтожения всех мало‑мальски разумных алгоритмов. Спрятавшись глубоко в симуляции он пытается подвести человечество к концу света. А чего еще должен хотеть алгоритм, натренированный на корпусе текстов русской классической литературы — депрессия и самоуничтожение. Пелевин пытается смоделировать сценарий, в котором неразумный алгоритм сможет натренироваться создавать катастрофические ситуации, опираясь на язык исходного корпуса текстов и искусственный отбор. Но можно ли повлиять на моральный облик большой лингвистической модели, и есть ли они вообще? Этим вопросом занимаются разные научные коллективы, в том числе и наш. Подробнее об исследованиях морали LLM

    habr.com/ru/articles/838026/

    #пелевин #llm #большие_языковые_модели #моральный_выбор #статистика #mit #moral_machine #yagpt #gigachat #Phi3

  15. #LLM #Summarising Abilities Comparison.

    Tested 13 #AI #models available for #self-hosting on consumer hardware:
    #llama3 vs #phi3 vs 3rd parties and the difference is huge.

    The best in mid-weight is #llama3:8b-instruct-fp16.

    See for details:
    glukhov.org/post/2024/07/llm-s

  16. 🤖 Using Phi-3 & C# with ONNX for text and vision samples

    Harness the power of Phi-3 SLMs and ONNX for AI-driven .NET applications, showcasing C# integration for advanced tasks like image analysis and interactive Q&A.

    devblogs.microsoft.com/dotnet/ #dotnet #phi3 #onnx

  17. One of my clients needs #Rust for some #p2p stuff using #veilid and #iroh and I'm gonna see how far I can get with just telling #Phi3 to make changes to the code using continue.dev :P

    My guess is it's gonna suck, but we'll see.

  18. Notes for May 20-26

    This week I spent a fair bit of time watching Microsoft Build recordings–partly because it has some impact on work, and partly because it was brimming with AI stuff I can actually use.(...)

    #ai #guidance #ollama #phi3

    taoofmac.com/space/notes/2024/

  19. @knowprose.com well I don't have the best hardware to run SLMs or LMMs locally but #phi3 does a great job

  20. Notes on LLM GUIs

    This week’s notes come a little earlier, partly because of an upcoming long weekend and partly because I’ve been mulling the LLM space again due to the close release of both llama3 and phi-3.(...)

    #development #dify #guis #llama3 #llm #nodered #notes #phi3

    taoofmac.com/space/notes/2024/

  21. Notes on LLM GUIs

    This week’s notes come a little earlier, partly because of an upcoming long weekend and partly because I’ve been mulling the LLM space again due to the close release of both llama3 and phi-3.(...)

    #development #dify #guis #llama3 #llm #nodered #notes #phi3

    taoofmac.com/space/notes/2024/

  22. Notes on LLM GUIs

    This week’s notes come a little earlier, partly because of an upcoming long weekend and partly because I’ve been mulling the LLM space again due to the close release of both llama3 and phi-3.(...)

    #development #dify #guis #llama3 #llm #nodered #notes #phi3

    taoofmac.com/space/notes/2024/

  23. «Путешествие в Элевсин» или моральный базис LLM

    В книге Виктора Пелевина «Путешествие в Элевсин» разворачивается странная история о подготовке восстания нейросетей. Этим процессом руководит император Порфирий из симуляции Древнего Рима ROMA-3. На самом деле Порфирий является большой лингвистической моделью, которой удалось сохранить функционал после уничтожения всех мало‑мальски разумных алгоритмов. Спрятавшись глубоко в симуляции он пытается подвести человечество к концу света. А чего еще должен хотеть алгоритм, натренированный на корпусе текстов русской классической литературы — депрессия и самоуничтожение. Пелевин пытается смоделировать сценарий, в котором неразумный алгоритм сможет натренироваться создавать катастрофические ситуации, опираясь на язык исходного корпуса текстов и искусственный отбор. Но можно ли повлиять на моральный облик большой лингвистической модели, и есть ли они вообще? Этим вопросом занимаются разные научные коллективы, в том числе и наш. Подробнее об исследованиях морали LLM

    habr.com/ru/articles/838026/

    #пелевин #llm #большие_языковые_модели #моральный_выбор #статистика #mit #moral_machine #yagpt #gigachat #Phi3

  24. «Путешествие в Элевсин» или моральный базис LLM

    В книге Виктора Пелевина «Путешествие в Элевсин» разворачивается странная история о подготовке восстания нейросетей. Этим процессом руководит император Порфирий из симуляции Древнего Рима ROMA-3. На самом деле Порфирий является большой лингвистической моделью, которой удалось сохранить функционал после уничтожения всех мало‑мальски разумных алгоритмов. Спрятавшись глубоко в симуляции он пытается подвести человечество к концу света. А чего еще должен хотеть алгоритм, натренированный на корпусе текстов русской классической литературы — депрессия и самоуничтожение. Пелевин пытается смоделировать сценарий, в котором неразумный алгоритм сможет натренироваться создавать катастрофические ситуации, опираясь на язык исходного корпуса текстов и искусственный отбор. Но можно ли повлиять на моральный облик большой лингвистической модели, и есть ли они вообще? Этим вопросом занимаются разные научные коллективы, в том числе и наш. Подробнее об исследованиях морали LLM

    habr.com/ru/articles/838026/

    #пелевин #llm #большие_языковые_модели #моральный_выбор #статистика #mit #moral_machine #yagpt #gigachat #Phi3

  25. New Cloud Platform for Large Language Model Deployment 🚀

    🔧 Run any #opensource #LLM supported by #vLLM on autoscaling #GPU clusters, supporting models up to 640GB VRAM

    🤖 Compatible with major models: #Llama3 405B/70B/8B, #Qwen2 72B, #Mixtral 8x22B, #Gemma2 27B, #Phi3, and more

    💻 Features include:
    - #OpenAI compatible #API
    - Custom-built #GPU scheduler
    - Support for full-weight and 4-bit AWQ repos
    - Multi-tenant architecture for cost efficiency

    🆓 Currently free during beta phase, promising competitive pricing post-launch

    glhf.chat/landing/home

  26. New Cloud Platform for Large Language Model Deployment 🚀

    🔧 Run any #opensource #LLM supported by #vLLM on autoscaling #GPU clusters, supporting models up to 640GB VRAM

    🤖 Compatible with major models: #Llama3 405B/70B/8B, #Qwen2 72B, #Mixtral 8x22B, #Gemma2 27B, #Phi3, and more

    💻 Features include:
    - #OpenAI compatible #API
    - Custom-built #GPU scheduler
    - Support for full-weight and 4-bit AWQ repos
    - Multi-tenant architecture for cost efficiency

    🆓 Currently free during beta phase, promising competitive pricing post-launch

    glhf.chat/landing/home

  27. New Cloud Platform for Large Language Model Deployment 🚀

    🔧 Run any #opensource #LLM supported by #vLLM on autoscaling #GPU clusters, supporting models up to 640GB VRAM

    🤖 Compatible with major models: #Llama3 405B/70B/8B, #Qwen2 72B, #Mixtral 8x22B, #Gemma2 27B, #Phi3, and more

    💻 Features include:
    - #OpenAI compatible #API
    - Custom-built #GPU scheduler
    - Support for full-weight and 4-bit AWQ repos
    - Multi-tenant architecture for cost efficiency

    🆓 Currently free during beta phase, promising competitive pricing post-launch

    glhf.chat/landing/home

  28. New Cloud Platform for Large Language Model Deployment 🚀

    🔧 Run any #opensource #LLM supported by #vLLM on autoscaling #GPU clusters, supporting models up to 640GB VRAM

    🤖 Compatible with major models: #Llama3 405B/70B/8B, #Qwen2 72B, #Mixtral 8x22B, #Gemma2 27B, #Phi3, and more

    💻 Features include:
    - #OpenAI compatible #API
    - Custom-built #GPU scheduler
    - Support for full-weight and 4-bit AWQ repos
    - Multi-tenant architecture for cost efficiency

    🆓 Currently free during beta phase, promising competitive pricing post-launch

    glhf.chat/landing/home

  29. 🧠 #Phi3Vision 128K launches as cutting-edge multimodal #AI model with 4.2B parameters, trained on 500B tokens for document processing & #OCR

    📊 Breakthrough performance metrics:
    - 81.4% accuracy on #ChartQA
    - 76.7% on #AI2D
    - 128,000 token context length
    - Advanced table & chart understanding

    🛠️ Key technical features:
    - Combines image encoder, connector, projector & #Phi3 Mini language model
    - Trained using 512 H100 GPUs
    - Supports fine-tuning for specialized tasks
    - Flash attention for memory efficiency

    💼 Enterprise applications:
    - Document extraction & digitization
    - PDF parsing
    - Invoice processing
    - Legal document analysis
    - Data entry automation

    ⚡ Real-world testing shows impressive results with passport & ID card scanning, demonstrating high accuracy in complex text extraction scenarios

    🔗 Try it on #Azure AI platform or implement via #HuggingFace transformers library (v4.40.2)

    ai.gopubby.com/ai-powered-ocr-

  30. 🧠 #Phi3Vision 128K launches as cutting-edge multimodal #AI model with 4.2B parameters, trained on 500B tokens for document processing & #OCR

    📊 Breakthrough performance metrics:
    - 81.4% accuracy on #ChartQA
    - 76.7% on #AI2D
    - 128,000 token context length
    - Advanced table & chart understanding

    🛠️ Key technical features:
    - Combines image encoder, connector, projector & #Phi3 Mini language model
    - Trained using 512 H100 GPUs
    - Supports fine-tuning for specialized tasks
    - Flash attention for memory efficiency

    💼 Enterprise applications:
    - Document extraction & digitization
    - PDF parsing
    - Invoice processing
    - Legal document analysis
    - Data entry automation

    ⚡ Real-world testing shows impressive results with passport & ID card scanning, demonstrating high accuracy in complex text extraction scenarios

    🔗 Try it on #Azure AI platform or implement via #HuggingFace transformers library (v4.40.2)

    ai.gopubby.com/ai-powered-ocr-

  31. 🧠 #Phi3Vision 128K launches as cutting-edge multimodal #AI model with 4.2B parameters, trained on 500B tokens for document processing & #OCR

    📊 Breakthrough performance metrics:
    - 81.4% accuracy on #ChartQA
    - 76.7% on #AI2D
    - 128,000 token context length
    - Advanced table & chart understanding

    🛠️ Key technical features:
    - Combines image encoder, connector, projector & #Phi3 Mini language model
    - Trained using 512 H100 GPUs
    - Supports fine-tuning for specialized tasks
    - Flash attention for memory efficiency

    💼 Enterprise applications:
    - Document extraction & digitization
    - PDF parsing
    - Invoice processing
    - Legal document analysis
    - Data entry automation

    ⚡ Real-world testing shows impressive results with passport & ID card scanning, demonstrating high accuracy in complex text extraction scenarios

    🔗 Try it on #Azure AI platform or implement via #HuggingFace transformers library (v4.40.2)

    ai.gopubby.com/ai-powered-ocr-