home.social

#tsne — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #tsne, aggregated by home.social.

  1. Experimenting with using t-SNE to plot @boldsystems.bsky.social DNA barcodes in "sequence space" (in this case, defined by k-mer vectors). This example is bold-view-bf2dfe9b0db3.herokuapp.com/record/GMESB... where the BIN BOLD:ACP0173 looks to comprise two distinct clusters.

  2. #ReleaseTuesday — New version of thi.ng/tsne with ~15-20% better performance[1] due to avoiding repeated internal allocations and skipping gradient updates where unnecessary...

    [1] Benchmarked with multiple datasets of ~750 items, each with 192 dimensions (now ~165ms @ MBA M1, 2020)...

    #ThingUmbrella #TSNE #DataViz #Visualization #ML #Cluster #TypeScript #JavaScript

  3. Может ли простейшая нейросеть найти математическую закономерность в данных?

    В этой небольшой статье мы научим нейросеть решать задачу умножения перестановок длины 5 (группа ) и визуализируем результаты обучения с помощью методов проекции t-SNE (с понижением размерности PCA) и алгоритма UMAP. Мы убедимся в том, что даже элементарная модель может "неосознанно" провести бинарную классификацию перестановок.

    habr.com/ru/articles/851214/

    #перестановки #переобучение #нейросеть #tsne #визуализация

  4. Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

    В этой статье я расскажу про свой опыт решения рабочей задачи — анализ отзывов о компании от пользователей. Мы разберем возможные ошибки и посмотрим на пример кода и реальных данных. Гайд будет полезен всем, у кого нет большого опыта в анализе данных или работе с LLM через API.

    habr.com/ru/articles/821287/

    #llm #gpt #chatgpt #python #clustering #kmeans #tsne #visualization #summarization #data_analysis

  5. Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

    В этой статье я расскажу про свой опыт решения рабочей задачи — анализ отзывов о компании от пользователей. Мы разберем возможные ошибки и посмотрим на пример кода и реальных данных. Гайд будет полезен всем, у кого нет большого опыта в анализе данных или работе с LLM через API.

    habr.com/ru/articles/821287/

    #llm #gpt #chatgpt #python #clustering #kmeans #tsne #visualization #summarization #data_analysis

  6. Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

    В этой статье я расскажу про свой опыт решения рабочей задачи — анализ отзывов о компании от пользователей. Мы разберем возможные ошибки и посмотрим на пример кода и реальных данных. Гайд будет полезен всем, у кого нет большого опыта в анализе данных или работе с LLM через API.

    habr.com/ru/articles/821287/

    #llm #gpt #chatgpt #python #clustering #kmeans #tsne #visualization #summarization #data_analysis

  7. “Biostatistician Rafael Irizarry… dislikes many of the t-SNE and UMAP plots he sees. They offer little of value to a paper, he says, and the output from these tools is analytically intractable.”

    nature.com/articles/s41592-024

  8. The difference between mapping an n-dimensional feature space to three or two dimensions.

    Source: lvdmaaten.github.io/tsne/ #tsne

  9. By the way this is the original article that presents t-SNE. Published 11/2008
    jmlr.org/papers/volume9/vander
    T-distributed stochastic neighbor embedding (t-SNE) is a statistical method for visualizing high-dimensional data in 2 or 3 dimensions.
    #DataVisualization #tSNE #MachineLearning #DimensionalityReduction #DataScience #AI #DataAnalysis #DataAnalytics

  10. I made a short video of the strange things UMAP and t-SNE can do to your data. The algorithms are shown mostly working as intended, yet with some surprising consequences.

    #umap #tsne #scrnaseq #wtf

    youtube.com/watch?v=gwqU9OoFwj

  11. "certain kinds of important high-dimensional geometric features are, unfortunately, mathematically impossible to represent in the 2D Euclidean plane, no matter what method is used, leading to distorted visualizations and missed geometric, and potentially biological, insights at both local and global scales."

    Wang et al. What cannot be seen correctly in 2D visualizations of single-cell ’omics data? Cell Syst. 2023 Sep 20;14(9):723–731. DOI: doi.org/10.1016/j.cels.2023.07

    #genetics #tSNE #UMAP #omics

  12. Use of t-SNE and #UMAP is increasing in biology! So I wonder how stochasticity of both the algorithms affect how we interpret the results? Can somebody enlighten? (#tSNE at least makes it clear in its acronym that it is stochastic)

  13. The maths is the brain-child of Carlos Roca - I certainly didn't expect to publish a paper with these equations! Basically, Cross Entropy looks at the relative position of each each to all other cells, allowing you to test for differences in the "shape" of the #tSNE or #UMAP. 5/6

  14. We have an exciting #computational paper out in @[email protected]. Ever use a #tSNE or #UMAP in #scSeq, #flowcytometry or #masscytometry? It doesn't have to be just a pretty picture anymore - we've developed a statistical test to check for differences. 1/6

    cell.com/cell-reports-methods/

  15. The super cool thing is that once you've segmented them, you can start to cluster them based on simply properties like area, circularity and solidity.

    You can automatically classify into resting (red) and activated (green) microglia! How cool is that?
    #tSNE #ScienceMastodon

  16. Nothing like the #Kaggle #fashion #MNIST variant to make me feel like a real Elle Woods over here doing t-SNE on purses and saliency maps on ankle boots 😅

    github.com/janeadams/fashion_m

    #MachineLearning #WomeninSTEM #AI #ML #tsne #pca #WiDS #Python