OpenDataLab

OpenDataLab

OpenDataLab浦数 人工智能开放数据平台,是上海人工智能实验室在WAIC 2022科学前沿全体会议上发布“OpenXLab浦源”人工智能开源开放体系的核心项目之一。 OpenDataLab作为人工智能数据领域的探路者和开源数据社区的倡导者,围绕大模型数据开展多项前沿技术探索,构建面向大模型研发全流程的数据平台及大模型时代数据管理体系。合作联系:opendatalab_yunying(请标明来意)

公告
暂无公告
热门项目
52

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。

Python
52
7
15

WanJuan3.0(“万卷·丝路”)一个作为综合性的纯文本语料库,收集了多个国家地区的网络公开信息、文献、专利等资料,数据总规模超 1.2TB,Token 总数超过 300B(300 billion),处于国际领先水平。首期开源的语料库主要由泰语、俄语、阿拉伯语、韩语和越南语 5 个子集构成,每个子集的数据规模均超过 150GB。

15
5
0

[CVPR 2024] 3D Building Reconstruction from Monocular Remote Sensing Images with Multi-level Supervisions

Python
0
0
  • UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition

    Python
    0
    0
    Apache-2.0
    更新于 2025年11月12日
    Star
  • A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。

    Python
    52
    7
    NOASSERTION
    更新于 18 小时前
    Star
  • 暂无简介

    Jinja
    1
    0
    更新于 11 小时前
    Like
  • 暂无简介

    2
    0
    更新于 16 小时前
    Like
  • 暂无简介

    Python
    0
    0
    更新于 2025年11月12日
    Star
  • [ICCV25 Highlight] The official implementation of the paper "LEGION: Learning to Ground and Explain for Synthetic Image Detection"

    Python
    0
    0
    更新于 2025年11月12日
    Star
  • [NeurIPS 2025 �] FakeVLM: Advancing Synthetic Image Detection through Explainable Multimodal Models and Fine-Grained Artifact Analysis

    Python
    0
    0
    更新于 2025年11月12日
    Star
  • 暂无简介

    Jinja
    0
    0
    更新于 20 小时前
    Like
  • 暂无简介

    Jinja
    0
    0
    更新于 20 小时前
    Like
  • 暂无简介

    Jinja
    0
    0
    更新于 20 小时前
    Like
查看全部项目 >
公告
暂无公告
成就
71
Star
12
Fork
9.24k
Download
常用语言
Jinja
Python
TypeScript
JavaScript