#deepseekv3 — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #deepseekv3, aggregated by home.social.
-
DeepSeek-V3 from Scratch: Mixture of Experts (MoE) Table of Contents DeepSeek-V3 from Scratch: Mixture of Experts (MoE) The Scaling Challenge in Neural Networks Mixture of Experts (MoE): Mathematic...
#Deep #Learning #DeepSeek #Machine #Learning #Neural #Networks #Tutorial #deepseek-v3 #expert #routing
Origin | Interest | Match -
DeepSeek-V3 Model: Theory, Config, and Rotary Positional Embeddings Table of Contents DeepSeek-V3 Model: Theory, Config, and Rotary Positional Embeddings Introduction to the DeepSeek-V3 Model The F...
#DeepSeek-V3 #KV #Cache #MultiHead #Latent #Attention #RoPE #Tutorial #deepseekv3 #kv #cache
Origin | Interest | Match -
Beating GPT-5: DeepSeekMath-V2 Self-Corrects Logic Errors Presentational View Introduction Mathematics with the aid of artificial intelligence, is advancing rapidly. Innovations such as informal th...
#ai-in-mathematics #deepseekmath-v2 #deepseek-v3 #open-source-ai-model #theorem-proving
Origin | Interest | Match -
🚀 Welcome GLM-4.6 the Latest flagship #opensource #AI #llm with advanced agentic, reasoning & coding capabilities
⚡ Performance improvements over #GLM45 with competitive advantages against #DeepSeekV3 and #ClaudeSonnet4 across 8 public benchmarks covering agents, reasoning & coding
🧵 👇
-
DeepSeek: Everything you need to know about the AI chatbot app
-
Насколько зацензурен и опасен DeepSeek?
Насколько предвзят искусственный интеллект? Принято ругать нейросети за трансляцию стереотипов человеческого мышления, которые были подсмотрены в датасетах предобучения. На деле ИИ куда более аккуратен, чем можно ожидать. Хороший пример — генерация фотографий бабочек. Как правило, дизайнеры-люди очень любят изображать бабочек в мёртвом виде. Дело в том, что энтомологи руководствуются строгими визуальными стандартами: вид сверху, расправленные на 180° крылья, чистый фон, симметрия.
https://habr.com/ru/articles/949540/
#DeepSeek #DeepSeekR1 #DeepSeekV3 #КНР #Китай #большие_языковые_модели #БЯМ #искусственный_интеллект #предвзятость #цензура
-
https://technologiesinternetz.blogspot.com/2025/08/deepseek-v31-vs-gpt-5-vs-claude-41.html
DeepSeek V3.1 vs GPT-5 vs Claude 4.1: Which LLM Delivers the Best Value to Users?
#deepseekv3.1 #gpt5 #claude4.1 #LLM
-
https://www.europesays.com/uk/368458/ DeepSeek V3.1 Released: The Intriguing UE8M0 FP8 #Computing #DeepSeekV3.1 #DomesticAIIndustry #EnflameTechnology #FloatingPointNumbers #FP16 #FP32 #FP8 #HigherThinkingEfficiency #HybridInferenceArchitecture #L600Chip #MagicStoneXiYunC600 #MXFP8 #ParameterPrecision #SoftwareHardwareCollaboration #StrongerAgentCapability #Technology #UE8M0FP8 #UK #UnitedKingdom
-
DeepSeek V3.1 Released: The Intriguing UE8M0 FP8
DeepSeek has launched version V3.1. Let’s briefly go through the highlights: Hybrid Infe…
#NewsBeep #News #Computing #AU #Australia #DeepSeekV3.1 #domesticAIindustry #EnflameTechnology #floatingpointnumbers #FP16 #FP32 #FP8 #HigherThinkingEfficiency #HybridInferenceArchitecture #L600chip #MagicStoneXiYunC600 #MXFP8 #parameterprecision #software-hardwarecollaboration #StrongerAgentCapability #Technology #UE8M0FP8
https://www.newsbeep.com/au/87765/ -
🧩 #Llama4Maverick nutzt 128 Experten für deutlich mehr Rechenleistung und schlägt sogar #GPT4o und #Gemini20 in Benchmarks – bei nur der Hälfte der aktiven Parameter von #DeepSeekv3.
🎓 Beide #KIModelle wurden mithilfe des riesigen Lehrmodells #Llama4 Behemoth trainiert, das mit 288 Milliarden aktiven Parametern zu den leistungsstärksten weltweit zählt.
👉 https://eicker.TV #Technik #Medien #Politik #Wirtschaft (2/2)
-
Studie: #KI #Chatbots sind beim Zitieren von #News unbrauchbar
https://www.derstandard.at/story/3000000261220/studie-ki-chatbots-sind-beim-zitieren-von-news-unbrauchbar"Untersucht wurden #ChatGPT Search (#OpenAI), #Perplexity, Perplexity Pro (Perplexity AI), #Gemini 2.0 Flash (#Google), #DeepseekV3 Search (#Deepseek), #Grok-2 Search, Grok-3 Search Beta (#xAI) sowie #Copilot (#Microsoft und OpenAI)."
"#Grok3 [...] lieferte gleich in 96 Prozent aller Fälle falsche Antworten." 🤣
-
The Chinese firm said training the model cost just $5.6 million. Alibaba Cloud followed with a new generative AI model, while Microsoft alleges DeepSeek ‘distilled’ OpenAI’s work.#artificialintelligence #chatgpt #deepseek #deepseekr1 #deepseek-v3 #generativeai #Microsoft #nvidia #openai #reasoningmodels
DeepSeek Chatbot Beats OpenAI on App Store Leaderboard -
DeepSeek-V3: The AI Revolution Changing Everything You Know! #ArtificialIntelligence, #DeepSeekV3, #AIRevolution, #TechInnovation, #OpenSourceAI, #FutureTech, #DigitalTransformation, #TechNews, #AIForGood, #Greenground The AI world just got rocked by DeepSeek-V3! This https://t.co/hza9QjTXmG on https://twitter.com/AcerboLivio/status/1873396907378139174