28 millions de commentaires HN vectorisés dans ClickHouse — un dataset idéal pour tester la recherche sémantique sur du contenu technique dense.
Lien source
28M Hacker News comments as vector embedding search dataset
Discussion sur Hacker News (454 points)