home.social

#word2vec — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #word2vec, aggregated by home.social.

  1. От «яблока» до «королевы»: как нейросети учатся понимать смысл слов через эмбеддинги

    Представьте, что вы объясняете ребёнку, что такое «яблоко». Вы покажете картинку, дадите попробовать, расскажете, что оно круглое, сладкое, растёт на дереве, а теперь попробуйте объяснить это нейросети. Она не видит, не пробует, но она понимает только числа. Как же тогда заставить машину понять, что «яблоко» ближе к «груше», чем к «трактору»? Ответ на самом деле кроется в элегантном приёме, который произвёл революцию в NLP- векторных представлениях слов , или эмбеддингах . Проблема «слепого» кодирования: почему one-hot не работает Самый наивный подход- это пронумеровать все слова в словаре и закодировать каждое вектором из нулей и одной единицы:

    habr.com/ru/articles/992928/

    #эмбеддинги #word2vec #nlp #машинное_обучение #векторные_представления #косинусное_сходство #обработка_естественного_языка #нейросети #нейросеть #нейросети_python

  2. История развития языковых моделей: ч. 2, от ChatGPT до рассуждающего режима

    Доброго времени суток, «Хабр»! В предыдущей части мы рассмотрели историю языковых моделей от робких шагов Маркова до долгой краткосрочной памяти. Сегодня мы продолжим, пройдемся по ключевым архитектурам последних лет и разберём, как модели научились интерпретировать контекст, предсказывать и даже спорить логически. Пристегните токены — вход в зону трансформаций!

    habr.com/ru/companies/bothub/a

    #word2vec #трансформер #токенизация #bert #chatgpt #t5

  3. История развития языковых моделей: ч. 2, от ChatGPT до рассуждающего режима

    Доброго времени суток, «Хабр»! В предыдущей части мы рассмотрели историю языковых моделей от робких шагов Маркова до долгой краткосрочной памяти. Сегодня мы продолжим, пройдемся по ключевым архитектурам последних лет и разберём, как модели научились интерпретировать контекст, предсказывать и даже спорить логически. Пристегните токены — вход в зону трансформаций!

    habr.com/ru/companies/bothub/a

    #word2vec #трансформер #токенизация #bert #chatgpt #t5

  4. История развития языковых моделей: ч. 2, от ChatGPT до рассуждающего режима

    Доброго времени суток, «Хабр»! В предыдущей части мы рассмотрели историю языковых моделей от робких шагов Маркова до долгой краткосрочной памяти. Сегодня мы продолжим, пройдемся по ключевым архитектурам последних лет и разберём, как модели научились интерпретировать контекст, предсказывать и даже спорить логически. Пристегните токены — вход в зону трансформаций!

    habr.com/ru/companies/bothub/a

    #word2vec #трансформер #токенизация #bert #chatgpt #t5

  5. История развития языковых моделей: ч. 2, от ChatGPT до рассуждающего режима

    Доброго времени суток, «Хабр»! В предыдущей части мы рассмотрели историю языковых моделей от робких шагов Маркова до долгой краткосрочной памяти. Сегодня мы продолжим, пройдемся по ключевым архитектурам последних лет и разберём, как модели научились интерпретировать контекст, предсказывать и даже спорить логически. Пристегните токены — вход в зону трансформаций!

    habr.com/ru/companies/bothub/a

    #word2vec #трансформер #токенизация #bert #chatgpt #t5

  6. Ведущий разработчик ChatGPT и его новый проект — Безопасный Сверхинтеллект

    Многие знают об Илье Суцкевере только то, что он выдающийся учёный и программист, родился в СССР, соосновал OpenAI и входит в число тех, кто в 2023 году изгнал из компании менеджера Сэма Альтмана. А когда того вернули, Суцкевер уволился по собственному желанию в новый стартап Safe Superintelligence («Безопасный Сверхинтеллект»). Илья Суцкевер действительно организовал OpenAI вместе с Маском, Брокманом, Альтманом и другими единомышленниками, причём был главным техническим гением в компании. Ведущий учёный OpenAI сыграл ключевую роль в разработке ChatGPT и других продуктов. Сейчас Илье всего 38 лет — совсем немного для звезды мировой величины.

    habr.com/ru/companies/ruvds/ar

    #Илья_Суцкевер #Ilya_Sutskever #OpenAI #10x_engineer #AlexNet #Safe_Superintelligence #ImageNet #неокогнитрон #GPU #GPGPU #CUDA #компьютерное_зрение #LeNet #Nvidia_GTX 580 #DNNResearch #Google_Brain #Алекс_Крижевски #Джеффри_Хинтон #Seq2seq #TensorFlow #AlphaGo #Томаш_Миколов #Word2vec #fewshot_learning #машина_Больцмана #сверхинтеллект #GPT #ChatGPT #ruvds_статьи

  7. We recently concluded the first year of teaching Advanced Information Retrieval @elex and want to highlight five projects from the class: socialcomplab.github.io/advanc

    The projects are diverse regarding what aspects of information retrieval they cover, the models used, and their domain, such as #Transformers, re-#ranking, #BERT opic, summarization, translation, #Word2Vec, content analysis, #IR pipelines, #T5, #programming languages, misinformation, #sBERT, tokenizers and encoders.