#seq2seq — Public Fediverse posts on home.social

Habr @[email protected] · 2025-12-23 · 14:12 UTC

Фундаментальный разбор: эволюция архитектур нейросетей от перцептрона до трансформера

Доброго времени суток, «Хабр»! Устал я делать разного рода сравнения и составлять топы среди недавно вышедших моделей. Восемь месяцев назад вышла моя статья, рассказывающая о пути, который нейросети проделали от цепей Маркова до современных языковых моделей. Размышляя над старыми материалами, я подумал: а почему бы снова не углубиться в историю и не рассмотреть развитие архитектур моделей? Присаживайтесь поудобнее, а я начинаю свой рассказ, в котором пройду путь от перцептрона до современного трансформера.

https://habr.com/ru/companies/bothub/articles/979594/

#ai #ии #нейросеть #архитектура_ии #перцептрон #рекуррентные_нейронные_сети #сверточные_нейросети #lstm #gan #seq2seq

#seq2seq #gan #lstm #сверточные_нейросети #рекуррентные_нейронные_сети #перцептрон

Habr @[email protected] · 2025-12-23 · 14:12 UTC

Фундаментальный разбор: эволюция архитектур нейросетей от перцептрона до трансформера

Доброго времени суток, «Хабр»! Устал я делать разного рода сравнения и составлять топы среди недавно вышедших моделей. Восемь месяцев назад вышла моя статья, рассказывающая о пути, который нейросети проделали от цепей Маркова до современных языковых моделей. Размышляя над старыми материалами, я подумал: а почему бы снова не углубиться в историю и не рассмотреть развитие архитектур моделей? Присаживайтесь поудобнее, а я начинаю свой рассказ, в котором пройду путь от перцептрона до современного трансформера.

https://habr.com/ru/companies/bothub/articles/979594/

#ai #ии #нейросеть #архитектура_ии #перцептрон #рекуррентные_нейронные_сети #сверточные_нейросети #lstm #gan #seq2seq

#seq2seq #gan #lstm #сверточные_нейросети #рекуррентные_нейронные_сети #перцептрон

Habr @[email protected] · 2025-12-23 · 14:12 UTC

Фундаментальный разбор: эволюция архитектур нейросетей от перцептрона до трансформера

Доброго времени суток, «Хабр»! Устал я делать разного рода сравнения и составлять топы среди недавно вышедших моделей. Восемь месяцев назад вышла моя статья, рассказывающая о пути, который нейросети проделали от цепей Маркова до современных языковых моделей. Размышляя над старыми материалами, я подумал: а почему бы снова не углубиться в историю и не рассмотреть развитие архитектур моделей? Присаживайтесь поудобнее, а я начинаю свой рассказ, в котором пройду путь от перцептрона до современного трансформера.

https://habr.com/ru/companies/bothub/articles/979594/

#ai #ии #нейросеть #архитектура_ии #перцептрон #рекуррентные_нейронные_сети #сверточные_нейросети #lstm #gan #seq2seq

#seq2seq #gan #lstm #сверточные_нейросети #рекуррентные_нейронные_сети #перцептрон

Habr @[email protected] · 2025-12-23 · 14:12 UTC

Фундаментальный разбор: эволюция архитектур нейросетей от перцептрона до трансформера

Доброго времени суток, «Хабр»! Устал я делать разного рода сравнения и составлять топы среди недавно вышедших моделей. Восемь месяцев назад вышла моя статья, рассказывающая о пути, который нейросети проделали от цепей Маркова до современных языковых моделей. Размышляя над старыми материалами, я подумал: а почему бы снова не углубиться в историю и не рассмотреть развитие архитектур моделей? Присаживайтесь поудобнее, а я начинаю свой рассказ, в котором пройду путь от перцептрона до современного трансформера.

https://habr.com/ru/companies/bothub/articles/979594/

#ai #ии #нейросеть #архитектура_ии #перцептрон #рекуррентные_нейронные_сети #сверточные_нейросети #lstm #gan #seq2seq

#ai #ии #нейросеть #архитектура_ии #перцептрон #рекуррентные_нейронные_сети

Habr @[email protected] · 2025-04-10 · 15:32 UTC

12 событий апреля, которые нельзя пропустить

Мы собрали для вас серию открытых уроков, которые пройдут в апреле и помогут не просто разобраться в сложных темах, а применить знания на практике. Будущее AI агентов на основе LLM, Prometheus для мониторинга, как избежать хаоса в IT-проектах и как обучить модель понимать языки — на эти и не только темы поговорим с экспертами в IT. Рассмотрим реальные кейсы, обсудим опыт и получим понимание того, как внедрять эти технологии в проекты.

https://habr.com/ru/companies/otus/articles/899644/

#AI_агенты #Scrum #seq2seq #автоматизация_тестирования #Docker #Apache_Kafka #Смартконтракты #data_science #prometheus

#ai_агенты #scrum #seq2seq #автоматизация_тестирования #docker #apache_kafka

Habr @[email protected] · 2025-04-07 · 09:12 UTC

Ведущий разработчик ChatGPT и его новый проект — Безопасный Сверхинтеллект

Многие знают об Илье Суцкевере только то, что он выдающийся учёный и программист, родился в СССР, соосновал OpenAI и входит в число тех, кто в 2023 году изгнал из компании менеджера Сэма Альтмана. А когда того вернули, Суцкевер уволился по собственному желанию в новый стартап Safe Superintelligence («Безопасный Сверхинтеллект»). Илья Суцкевер действительно организовал OpenAI вместе с Маском, Брокманом, Альтманом и другими единомышленниками, причём был главным техническим гением в компании. Ведущий учёный OpenAI сыграл ключевую роль в разработке ChatGPT и других продуктов. Сейчас Илье всего 38 лет — совсем немного для звезды мировой величины.

https://habr.com/ru/companies/ruvds/articles/892646/

#Илья_Суцкевер #Ilya_Sutskever #OpenAI #10x_engineer #AlexNet #Safe_Superintelligence #ImageNet #неокогнитрон #GPU #GPGPU #CUDA #компьютерное_зрение #LeNet #Nvidia_GTX 580 #DNNResearch #Google_Brain #Алекс_Крижевски #Джеффри_Хинтон #Seq2seq #TensorFlow #AlphaGo #Томаш_Миколов #Word2vec #fewshot_learning #машина_Больцмана #сверхинтеллект #GPT #ChatGPT #ruvds_статьи

#илья_суцкевер #ilya_sutskever #openai #10x_engineer #alexnet #safe_superintelligence

Habr @[email protected] · 2025-04-07 · 09:12 UTC

Ведущий разработчик ChatGPT и его новый проект — Безопасный Сверхинтеллект

Многие знают об Илье Суцкевере только то, что он выдающийся учёный и программист, родился в СССР, соосновал OpenAI и входит в число тех, кто в 2023 году изгнал из компании менеджера Сэма Альтмана. А когда того вернули, Суцкевер уволился по собственному желанию в новый стартап Safe Superintelligence («Безопасный Сверхинтеллект»). Илья Суцкевер действительно организовал OpenAI вместе с Маском, Брокманом, Альтманом и другими единомышленниками, причём был главным техническим гением в компании. Ведущий учёный OpenAI сыграл ключевую роль в разработке ChatGPT и других продуктов. Сейчас Илье всего 38 лет — совсем немного для звезды мировой величины.

https://habr.com/ru/companies/ruvds/articles/892646/

#Илья_Суцкевер #Ilya_Sutskever #OpenAI #10x_engineer #AlexNet #Safe_Superintelligence #ImageNet #неокогнитрон #GPU #GPGPU #CUDA #компьютерное_зрение #LeNet #Nvidia_GTX 580 #DNNResearch #Google_Brain #Алекс_Крижевски #Джеффри_Хинтон #Seq2seq #TensorFlow #AlphaGo #Томаш_Миколов #Word2vec #fewshot_learning #машина_Больцмана #сверхинтеллект #GPT #ChatGPT #ruvds_статьи

#илья_суцкевер #ilya_sutskever #openai #10x_engineer #alexnet #safe_superintelligence

Habr @[email protected] · 2025-04-07 · 09:12 UTC

Ведущий разработчик ChatGPT и его новый проект — Безопасный Сверхинтеллект

Многие знают об Илье Суцкевере только то, что он выдающийся учёный и программист, родился в СССР, соосновал OpenAI и входит в число тех, кто в 2023 году изгнал из компании менеджера Сэма Альтмана. А когда того вернули, Суцкевер уволился по собственному желанию в новый стартап Safe Superintelligence («Безопасный Сверхинтеллект»). Илья Суцкевер действительно организовал OpenAI вместе с Маском, Брокманом, Альтманом и другими единомышленниками, причём был главным техническим гением в компании. Ведущий учёный OpenAI сыграл ключевую роль в разработке ChatGPT и других продуктов. Сейчас Илье всего 38 лет — совсем немного для звезды мировой величины.

https://habr.com/ru/companies/ruvds/articles/892646/

#Илья_Суцкевер #Ilya_Sutskever #OpenAI #10x_engineer #AlexNet #Safe_Superintelligence #ImageNet #неокогнитрон #GPU #GPGPU #CUDA #компьютерное_зрение #LeNet #Nvidia_GTX 580 #DNNResearch #Google_Brain #Алекс_Крижевски #Джеффри_Хинтон #Seq2seq #TensorFlow #AlphaGo #Томаш_Миколов #Word2vec #fewshot_learning #машина_Больцмана #сверхинтеллект #GPT #ChatGPT #ruvds_статьи

#илья_суцкевер #ilya_sutskever #openai #10x_engineer #alexnet #safe_superintelligence

Habr @[email protected] · 2025-04-07 · 09:12 UTC

Ведущий разработчик ChatGPT и его новый проект — Безопасный Сверхинтеллект

Многие знают об Илье Суцкевере только то, что он выдающийся учёный и программист, родился в СССР, соосновал OpenAI и входит в число тех, кто в 2023 году изгнал из компании менеджера Сэма Альтмана. А когда того вернули, Суцкевер уволился по собственному желанию в новый стартап Safe Superintelligence («Безопасный Сверхинтеллект»). Илья Суцкевер действительно организовал OpenAI вместе с Маском, Брокманом, Альтманом и другими единомышленниками, причём был главным техническим гением в компании. Ведущий учёный OpenAI сыграл ключевую роль в разработке ChatGPT и других продуктов. Сейчас Илье всего 38 лет — совсем немного для звезды мировой величины.

https://habr.com/ru/companies/ruvds/articles/892646/

#Илья_Суцкевер #Ilya_Sutskever #OpenAI #10x_engineer #AlexNet #Safe_Superintelligence #ImageNet #неокогнитрон #GPU #GPGPU #CUDA #компьютерное_зрение #LeNet #Nvidia_GTX 580 #DNNResearch #Google_Brain #Алекс_Крижевски #Джеффри_Хинтон #Seq2seq #TensorFlow #AlphaGo #Томаш_Миколов #Word2vec #fewshot_learning #машина_Больцмана #сверхинтеллект #GPT #ChatGPT #ruvds_статьи

#ruvds_статьи #chatgpt #gpt #сверхинтеллект #машина_больцмана #fewshot_learning

Habr @[email protected] · 2024-03-29 · 06:42 UTC

Обработка текста. Модель Sequence-to-sequence

Сегодня мы рассмотрим принцип работы модели seq2seq, модификации, как верно подготовить данные для модели.

https://habr.com/ru/articles/803815/

#data_science #seq2seq #токенизация #embeddings #llm #уии

#уии #llm #embeddings #токенизация #seq2seq #data_science

Habr @[email protected] · 2024-01-26 · 15:34 UTC

Предсказать ошибку. Как методы оценки неопределенности помогают повышать качество seq2seq-моделей

Всем привет! Меня зовут Артём Важенцев , я аспирант в Сколтехе и младший научный сотрудник AIRI. Наша группа занимается исследованием и разработкой новых методов оценивания неопределенности для языковых моделей. Этим летом мы опубликовали две статьи на ACL 2023 . Про одну из них я уже рассказывал в одном из предыдущих текстов — там мы описали новый гибридный метод оценивания неопределенности для задачи выборочной классификации текстов. Другая же статья про то, как мы адаптировали современные методы оценивания неопределенности на основе скрытого представления модели для задачи генерации текста, а так же показали их высокое качество и скорость работы для задачи обнаружения примеров вне обучающего распределения. Ниже я хотел бы подробнее рассказать об используемых методах и результатах, которые мы получили.

https://habr.com/ru/companies/airi/articles/787340/

#uncertainty_estimation #natural_language_processing #machine_translation #question_answering #summarization #seq2seq

#seq2seq #summarization #question_answering #machine_translation #natural_language_processing #uncertainty_estimation

Habr @[email protected] · 2024-01-26 · 15:34 UTC

Предсказать ошибку. Как методы оценки неопределенности помогают повышать качество seq2seq-моделей

Всем привет! Меня зовут Артём Важенцев , я аспирант в Сколтехе и младший научный сотрудник AIRI. Наша группа занимается исследованием и разработкой новых методов оценивания неопределенности для языковых моделей. Этим летом мы опубликовали две статьи на ACL 2023 . Про одну из них я уже рассказывал в одном из предыдущих текстов — там мы описали новый гибридный метод оценивания неопределенности для задачи выборочной классификации текстов. Другая же статья про то, как мы адаптировали современные методы оценивания неопределенности на основе скрытого представления модели для задачи генерации текста, а так же показали их высокое качество и скорость работы для задачи обнаружения примеров вне обучающего распределения. Ниже я хотел бы подробнее рассказать об используемых методах и результатах, которые мы получили.

https://habr.com/ru/companies/airi/articles/787340/

#uncertainty_estimation #natural_language_processing #machine_translation #question_answering #summarization #seq2seq

#seq2seq #summarization #question_answering #machine_translation #natural_language_processing #uncertainty_estimation

Félicien Breton @[email protected] · 2023-02-20 · 10:36 UTC

Cory Doctorow @pluralistic "on how a poisoned #ML system could be abused in ways that evade detection": https://pluralistic.net/2022/10/21/let-me-summarize/#i-read-the-abstract #LLM #seq2seq #metaBackdoor #machineLearning #ai #backdoors #modelSpinning #dataGovernance @dataGovernance #AIEthics #ethicalAI #retrieval #dataMining #dataDon #infoSec

#infosec #datadon #datamining #retrieval #ethicalai #aiethics

n0body @[email protected] · 2023-01-05 · 15:48 UTC

Can anyone recommend an online survey course on Neural Networks in Python? I'm especially interested in learning about applied #NLP, #RNN, #CNN, #Seq2Seq, #BERT, and #GPT. Thanks!

#nlp #rnn #cnn #seq2seq #bert #gpt

Dave in 🏴󠁧󠁢󠁳󠁣󠁴󠁿 @[email protected] · 2022-11-07 · 15:16 UTC

This is not to say, however, that I think these models are useless. I think the interesting question is how to integrate these models into systems that express a particular meaning, a la data-to-text #NaturalLanguageGeneration. Whether this involves #PromptEngineering, integrating them into the decoder for #seq2seq models, or some other more clever application remains to be seen. I am looking forward to seeing how #LLM/s get used for #NLG going forward.

#naturallanguagegeneration #promptengineering #seq2seq #llm #nlg

Dave in 🏴󠁧󠁢󠁳󠁣󠁴󠁿 @[email protected] · 2022-11-07 · 15:04 UTC

Around 2015 and 2016 we saw sequence-to-sequence (#seq2seq) models applied to data-to-text #NLG for the first time. These models were trained end-to-end and were very exciting because it raised the prospect of reducing the amount of hand-crafted #GrammarEngineering one would have to do to create a #NaturalLanguageGeneration system.

#seq2seq #nlg #grammarengineering #naturallanguagegeneration