Common Crawl est une organisation à but non lucratif qui gère le plus grand ensemble de données web ouvertes. L'indexation signifie que notre contenu fait partie d'une source de données cruciale pour l'entraînement de l'IA et la recherche académique.