
huggingface/datasets: 开源的多功能数据集库
2024-07-18 13:18
项目简介 huggingface/datasets 是一个提供大量现成数据集的开源库,专为机器学习模型设计。这个库支持一行代码加载多种公共数据集,包括图像、音频和文字数据集,并提供高效的数据预处理功能。它支持多种数据格式,如 CSV、JSON、文本、PNG、JPEG、WAV、MP3 和 Parque