home.social

#mechanisticinterpretability — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #mechanisticinterpretability, aggregated by home.social.

  1. Questions? Discussion? Reach out to us:

    Andreas Waldis (UKP Lab/Technische Universität Darmstadt and HSLU Hochschule Luzern), Vagrant Gautam (Universität des Saarlandes), Anne Lauscher (Universität Hamburg), Dietrich Klakow (Universität des Saarlandes), and Iryna Gurevych (UKP Lab/Technische Universität Darmstadt)

    #NLProc #Interpretability #LLMs #ExplainableAI #MechanisticInterpretability #AlignedProbing #ModelInternals