Tập dữ liệu - Datasets¶
Các tập dữ liệu công khai trong thị giác máy tính, xử lý ngôn ngữ tự nhiên và nhiều bài toán khác trong học máy và học sâu, tham khảo từ wiki awesome datasets của caesar0301.
Học máy - Machine Learning¶
Xử lý ảnh - Image Processing¶
Ngôn ngữ tự nhiên - Natural Language¶
Google MC-AFP, generated based on the public available Gigaword dataset using Paragraph Vectors
Machine Comprehension Test (MCTest) of text from Microsoft Research
Microsoft MAchine Reading COmprehension Dataset (or MS MARCO)
SaudiNewsNet Collection of Saudi Newspaper Articles (Arabic, 30K articles)
Chuỗi thời gian - Time Series¶
Các cuộc thi dữ liệu - Data Challenges¶
Các mạng phức tạp - Complex Networks¶
Mạng máy tính - Computer Networks¶
Công cụ tìm kiếm - Search Engines¶
Tên miền công khai - Public Domains¶
Phần mềm - Software¶
Kinh tế - Economics¶
Tài chính - Finance¶
Vật lý - Physics¶
Sinh học - Biology¶
NIH Microarray data or FTP (see FTP link on RAW)
Sanger Genomics of Drug Sensitivity in Cancer Project (GDSC)