home.social

#overfitting — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #overfitting, aggregated by home.social.

  1. I was working this week on a UI to help users understand when they’re #overfitting their data. Coming up with ideas for the #UI/#UX was proving to be difficult.

    My experience 2 months ago with #Claude was terrible. But this time the output from #ClaudeDesign, was pretty good: training vs prediction, noise and model complexity controls, and comparing fits across degrees.

    Needs improvement, but its a good starting point. AI in design is going to be a thing.

    #ux #ui #datascience #prototyping

  2. Furthermore, we were discussing overfitting as another major problem with machine learning. SImply memorising the data doesn't help, when you have to make predictions over unknown data. When overfitting, the model looses the ability to generalise...

    #AI #lecture #machine learning #KDAI2026 #overfitting #datascience #data @fiz_karlsruhe @fizise #knowledge

  3. 🔮 Behold, a revolutionary tome unveiling the mystical art of... splitting data sets! 🎩✨ Dive into a world where machine learning geniuses compete in a bizarre contest of who-can-overfit-the-best, and where #benchmarks are the sacred cow 🐄 that everyone loves to hate but won't stop worshipping. Spoiler: it's #groundbreaking, like discovering water is wet. 💧🤯
    mlbenchmarks.org/00-preface.ht #dataScience #machineLearning #overfitting #techHumor #HackerNews #ngated

  4. Растягиваем кошек, чтобы избежать переобучения. Аугментация данных в машинном обучении

    Главной проблемой при обучении нейросетей остаётся нехватка качественной информации. Всем моделям глубокого обучения может потребоваться большой объём данных для достижения удовлетворительных результатов. Для успешного обучения модели данные должны быть разнообразными и соответствовать поставленной задаче. В противном случае пользы от такой сети будет мало. Хорошо известно, что нехватка данных легко приводит к переобучению. Но вот беда, трудно предусмотреть и собрать данные, которые покрывали бы все ситуации. Допустим, вы хотите научить систему находить на фото конкретную кошку. Вам потребуются снимки этого животного в самых разных позах — будь то сидя, стоя или обдирающей диван. А если требуется распознавать кошек в принципе, то вариантов становится в разы больше. Видов кошек в природе тысячи, они все разных цветов и размеров. Почему это важно? Представьте, что наш набор данных может содержать изображения кошек и собак. Кошки в наборе смотрят исключительно влево с точки зрения наблюдателя. Неудивительно, что обученная модель может неправильно классифицировать кошек, смотрящих вправо. Поэтому всегда нужно проверять свою выборку на разнообразие. Если данные не подходят под реальные условия, то и задачу решить не получится. Что делать, если у нас дефицит данных?

    habr.com/ru/companies/ruvds/ar

    #ml #машинное+обучение #машинное_обучение #аугментация #аугментация_данных #переобучение #overfitting #синтетические_данные #ruvds_статьи

  5. Растягиваем кошек, чтобы избежать переобучения. Аугментация данных в машинном обучении

    Главной проблемой при обучении нейросетей остаётся нехватка качественной информации. Всем моделям глубокого обучения может потребоваться большой объём данных для достижения удовлетворительных результатов. Для успешного обучения модели данные должны быть разнообразными и соответствовать поставленной задаче. В противном случае пользы от такой сети будет мало. Хорошо известно, что нехватка данных легко приводит к переобучению. Но вот беда, трудно предусмотреть и собрать данные, которые покрывали бы все ситуации. Допустим, вы хотите научить систему находить на фото конкретную кошку. Вам потребуются снимки этого животного в самых разных позах — будь то сидя, стоя или обдирающей диван. А если требуется распознавать кошек в принципе, то вариантов становится в разы больше. Видов кошек в природе тысячи, они все разных цветов и размеров. Почему это важно? Представьте, что наш набор данных может содержать изображения кошек и собак. Кошки в наборе смотрят исключительно влево с точки зрения наблюдателя. Неудивительно, что обученная модель может неправильно классифицировать кошек, смотрящих вправо. Поэтому всегда нужно проверять свою выборку на разнообразие. Если данные не подходят под реальные условия, то и задачу решить не получится. Что делать, если у нас дефицит данных?

    habr.com/ru/companies/ruvds/ar

    #ml #машинное+обучение #машинное_обучение #аугментация #аугментация_данных #переобучение #overfitting #синтетические_данные #ruvds_статьи

  6. Растягиваем кошек, чтобы избежать переобучения. Аугментация данных в машинном обучении

    Главной проблемой при обучении нейросетей остаётся нехватка качественной информации. Всем моделям глубокого обучения может потребоваться большой объём данных для достижения удовлетворительных результатов. Для успешного обучения модели данные должны быть разнообразными и соответствовать поставленной задаче. В противном случае пользы от такой сети будет мало. Хорошо известно, что нехватка данных легко приводит к переобучению. Но вот беда, трудно предусмотреть и собрать данные, которые покрывали бы все ситуации. Допустим, вы хотите научить систему находить на фото конкретную кошку. Вам потребуются снимки этого животного в самых разных позах — будь то сидя, стоя или обдирающей диван. А если требуется распознавать кошек в принципе, то вариантов становится в разы больше. Видов кошек в природе тысячи, они все разных цветов и размеров. Почему это важно? Представьте, что наш набор данных может содержать изображения кошек и собак. Кошки в наборе смотрят исключительно влево с точки зрения наблюдателя. Неудивительно, что обученная модель может неправильно классифицировать кошек, смотрящих вправо. Поэтому всегда нужно проверять свою выборку на разнообразие. Если данные не подходят под реальные условия, то и задачу решить не получится. Что делать, если у нас дефицит данных?

    habr.com/ru/companies/ruvds/ar

    #ml #машинное+обучение #машинное_обучение #аугментация #аугментация_данных #переобучение #overfitting #синтетические_данные #ruvds_статьи

  7. Растягиваем кошек, чтобы избежать переобучения. Аугментация данных в машинном обучении

    Главной проблемой при обучении нейросетей остаётся нехватка качественной информации. Всем моделям глубокого обучения может потребоваться большой объём данных для достижения удовлетворительных результатов. Для успешного обучения модели данные должны быть разнообразными и соответствовать поставленной задаче. В противном случае пользы от такой сети будет мало. Хорошо известно, что нехватка данных легко приводит к переобучению. Но вот беда, трудно предусмотреть и собрать данные, которые покрывали бы все ситуации. Допустим, вы хотите научить систему находить на фото конкретную кошку. Вам потребуются снимки этого животного в самых разных позах — будь то сидя, стоя или обдирающей диван. А если требуется распознавать кошек в принципе, то вариантов становится в разы больше. Видов кошек в природе тысячи, они все разных цветов и размеров. Почему это важно? Представьте, что наш набор данных может содержать изображения кошек и собак. Кошки в наборе смотрят исключительно влево с точки зрения наблюдателя. Неудивительно, что обученная модель может неправильно классифицировать кошек, смотрящих вправо. Поэтому всегда нужно проверять свою выборку на разнообразие. Если данные не подходят под реальные условия, то и задачу решить не получится. Что делать, если у нас дефицит данных?

    habr.com/ru/companies/ruvds/ar

    #ml #машинное+обучение #машинное_обучение #аугментация #аугментация_данных #переобучение #overfitting #синтетические_данные #ruvds_статьи

  8. Why Does A.I. Write Like … That?

    Sam Kriss for the New York Times:

    """
    According to the data, post-ChatGPT papers lean more on words like “underscore,” “highlight” and “showcase” than pre-ChatGPT papers [..] And “delve” [..] shot up by 2,700 percent.
    """

    nytimes.com/2025/12/03/magazin

  9. Eine große Fehleinschätzung ist, dass #KünstlicheNeuronaleNetzwerke umso besser werden, je komplexer sie sind und je größer der Datensatz ist, mit dem sie trainiert werden. Die aktuell völlig unterschätzte Problematik von #Overfitting & #Overtraining sind potentielle Treiber des nächsten KI-Winters. #justsaying

  10. When Dimensionality Hurts: The Role of #LLM Embedding Compression for Noisy Regression Tasks d.repec.org/n?u=RePEc:arx:pape
    "… suggest that the optimal dimensionality is dependent on the signal-to-noise ratio, exposing the necessity of feature compression in high noise environments. The implication of the result is that researchers should consider the #noise of a task when making decisions about the dimensionality of text.

    … findings indicate that sentiment and emotion-based representations do not provide inherent advantages over learned latent features, implying that their previous success in similar tasks may be attributed to #regularisation effects rather than intrinsic informativeness."
    #ML #autoencoders #Overfitting

  11. 'On the Impact of Hard Adversarial Instances on Overfitting in Adversarial Training', by Chen Liu, Zhichao Huang, Mathieu Salzmann, Tong Zhang, Sabine Süsstrunk.

    jmlr.org/papers/v25/22-0950.ht

    #adversarial #overfitting #robustness

  12. 1/

    Recent commentary [1]:
    escalating concern over the use of the more powerful #chatbots when they are used to go beyond the #knowledge of the human expert who uses them, rather than for simply pre-processing in a controlled way within the domain of human-expert knowledge.

    1. ⁠What is often called "hallucination/confabulation” (i.e. severe #extrapolation #uncertainty and #overfitting by the chatbot model) is apparently becoming increasingly realistic with a declining human ability to detect it

  13. 'Benign Overfitting of Constant-Stepsize SGD for Linear Regression', by Difan Zou, Jingfeng Wu, Vladimir Braverman, Quanquan Gu, Sham M. Kakade.

    jmlr.org/papers/v24/21-1297.ht

    #overfitting #overparameterized #sgd

  14. One question for the #MachineLearning people: what approach do you use to determine if a decision trees or a random forest approach should work better? Do you simply try both approaches and use whatever seems to work better?

    According to what I read, decision trees are more prone to overfitting, while random forest is a more complex approach. Which means little to me 😅

    #ml #DecisionTrees #RandomForest #Overfitting

  15. Logistic-Normal Likelihoods for Heteroscedastic Label Noise

    Erik Englesson, Amir Mehrpanah, Hossein Azizpour

    Action editor: Bo Han.

    openreview.net/forum?id=7wA65z

    #label #classification #overfitting

  16. Learning Augmentation Distributions using Transformed Risk Minimization

    Evangelos Chatzipantazis, Stefanos Pertigkiozoglou, Kostas Daniilidis, Edgar Dobriban

    Action editor: Andriy Mnih.

    openreview.net/forum?id=LRYtNj

    #augmentation #augmentations #overfitting

  17. Catastrophic overfitting can be induced with discriminative non-robust features

    Guillermo Ortiz-Jimenez, Pau de Jorge, Amartya Sanyal et al.

    Action editor: Jakub Tomczak.

    openreview.net/forum?id=10hCbu

    #overfitting #adversarial #robust

  18. "#AI #art is leaking into the mainstream in the form of #stablediffusion and #Lensa, but there are serious #ethical concerns with this unregulated tech. I'm NOT anti AI, in fact, I believe AI can be of immense benefit to us in the future. But the ethics of AI in its current state MUST be talked about, in order to steer this tech in the right direction."

    youtube.com/watch?v=5Viy3Cu3DL

    #copyright #intellectualproperty #overfitting #LLM

  19. "#AI #art is leaking into the mainstream in the form of #stablediffusion and #Lensa, but there are serious #ethical concerns with this unregulated tech. I'm NOT anti AI, in fact, I believe AI can be of immense benefit to us in the future. But the ethics of AI in its current state MUST be talked about, in order to steer this tech in the right direction."

    youtube.com/watch?v=5Viy3Cu3DL

    #copyright #intellectualproperty #overfitting #LLM

  20. "#AI #art is leaking into the mainstream in the form of #stablediffusion and #Lensa, but there are serious #ethical concerns with this unregulated tech. I'm NOT anti AI, in fact, I believe AI can be of immense benefit to us in the future. But the ethics of AI in its current state MUST be talked about, in order to steer this tech in the right direction."

    youtube.com/watch?v=5Viy3Cu3DL

    #copyright #intellectualproperty #overfitting #LLM

  21. "#AI #art is leaking into the mainstream in the form of #stablediffusion and #Lensa, but there are serious #ethical concerns with this unregulated tech. I'm NOT anti AI, in fact, I believe AI can be of immense benefit to us in the future. But the ethics of AI in its current state MUST be talked about, in order to steer this tech in the right direction."

    youtube.com/watch?v=5Viy3Cu3DL

    #copyright #intellectualproperty #overfitting #LLM

  22. "#AI #art is leaking into the mainstream in the form of #stablediffusion and #Lensa, but there are serious #ethical concerns with this unregulated tech. I'm NOT anti AI, in fact, I believe AI can be of immense benefit to us in the future. But the ethics of AI in its current state MUST be talked about, in order to steer this tech in the right direction."

    youtube.com/watch?v=5Viy3Cu3DL

    #copyright #intellectualproperty #overfitting #LLM

  23. 4/
    A general issue concerns seductive #research black-box tools (or, equivalently, trending methods "inspired" by published works one doesn't really understand): easy to incur #overfitting, which implies modelling not only the "signal" being studied in too few data, but also (or mostly) their useless noise.

    Recursive: if we fall into the trap (no proper #validation), our readers may be led to believe that these shortcuts have a chance to work, perpetuating anti-culture.

    #ComputationalModelling

  24. This study finds that badly trained ML models overfit. IMHO nothing new. twitter.com/Eric_Wallace_/stat

    Quote:
    «
    Models such as Stable Diffusion are trained on copyrighted, trademarked, private, and sensitive images.

    Yet, our new paper shows that diffusion models memorize images from their training data and emit them at generation time.
    »

    For ref: #ai #machinelearning #ml #overfitting

  25. Most fields have only a few laws.

    I've been diving into #StaffordBeer over the past few days, #cybernetics guru of the 1970s-90s. His concepts of #AshbysLaw of #RequisiteVariety, and of #ViableSystemsModel get toward this. Notably, a model should be as simple as possible, but no simpler (Einstein).

    An overly complex model invites #overfitting

    Breakthroughs in domains occur where an accumulation of many complex rules can be discarded for a small set of simpler ones. Physics: Newton on gravity, motion, and optics. Chemistry: Mendeleev on chemical elements (valance electrons and atomic masses), Biology: Darwin and evolution (and genetics and DNA). Geology: Wegener and plate tectonics. Information; Shannon. Computer science: Turing & Church.

    The social sciences have been approached repeatedly by their core truth but to date have rejected it.

    11/

  26. Interpolation Can Provably Preclude Invariance arxiv.org/abs/2211.15724
    #Overfitting to the point of #interpolation can hinder invariance-inducing objectives: One cannot assume a #DeepLearninig model with an invariance penalty will indeed achieve any form of #invariance… suggests that “benign overfitting,” in which models generalize well despite interpolating, might not favorably extend to settings in which #robustness or #fairness are desirable.

  27. Interpolation Can Provably Preclude Invariance arxiv.org/abs/2211.15724
    #Overfitting to the point of #interpolation can hinder invariance-inducing objectives: One cannot assume a #DeepLearninig model with an invariance penalty will indeed achieve any form of #invariance… suggests that “benign overfitting,” in which models generalize well despite interpolating, might not favorably extend to settings in which #robustness or #fairness are desirable.

  28. Interpolation Can Provably Preclude Invariance arxiv.org/abs/2211.15724
    #Overfitting to the point of #interpolation can hinder invariance-inducing objectives: One cannot assume a #DeepLearninig model with an invariance penalty will indeed achieve any form of #invariance… suggests that “benign overfitting,” in which models generalize well despite interpolating, might not favorably extend to settings in which #robustness or #fairness are desirable.

  29. Interpolation Can Provably Preclude Invariance arxiv.org/abs/2211.15724
    #Overfitting to the point of #interpolation can hinder invariance-inducing objectives: One cannot assume a #DeepLearninig model with an invariance penalty will indeed achieve any form of #invariance… suggests that “benign overfitting,” in which models generalize well despite interpolating, might not favorably extend to settings in which #robustness or #fairness are desirable.

  30. Interpolation Can Provably Preclude Invariance arxiv.org/abs/2211.15724
    #Overfitting to the point of #interpolation can hinder invariance-inducing objectives: One cannot assume a #DeepLearninig model with an invariance penalty will indeed achieve any form of #invariance… suggests that “benign overfitting,” in which models generalize well despite interpolating, might not favorably extend to settings in which #robustness or #fairness are desirable.