古代家庭伦理小说 让大模子“巧妇”有“米”可炊, 他家的数据60家大模子抢着要
发布日期:2025-06-28 00:27 点击次数:69在一个群模共舞的时间,一家AI创业公司如何作念到行业头部?位于杭州萧山的景联文科技给出的谜底是古代家庭伦理小说,为大模子实际提供海量的数据。用CEO刘云涛的话来说,他们等于让大模子这些“巧妇”有“米”可炊。
大学时创业
拿到东谈主生第一个100万
刘云涛诞生于安徽一个营业家庭,从小的目染耳濡让他对创业充满了照看,在浙江大学城市学院读工商不断时,总思着我方折腾点什么事情出来。
大一暑假看着学校的体育场所空下来,刘云涛就琢磨要么办个跆拳谈培训班。他从5岁运行学习跆拳谈,曾赢得过多个奖项,国度二级领会员。自后培训班的面目从跆拳谈扩展到羽毛球、网球等其他领会,一度注册了专科的体育培训公司,赚到了东谈主生中的第一个100万。
“现在回过火去看,阿谁时候创业更多靠的是冲劲,从各方面讲齐比拟低级,不行称得上多收效,但也累积了负责的教诲,实行中深度学习了营业逻辑和不断政策,也让我更肯定我方的优流毒在何处。”
因为创业,刘云涛还请求了宽限毕业,延续少儿体育培训的途径,折腾过其他的面目。“不事自后的面目也莫得多收效,好在也没白‘挨打’。”提及我方前半程创业资历,刘云涛有种特有历尽千帆的云淡风轻。
从卖本事到卖材料
数据标注的价值被挖掘
景联文科技建立于2012年,咫尺是一家基于自研数据工程平台提供AI数据奇迹的科技企业。
开首几年,公司主营的业务是为各大手机厂商提供手机指纹防伪算法科罚决议,肤浅来说等于不行让别东谈主用假指纹来解锁你的手机,曾经赢得2017年和2019年的FingerprintLivenessDetectionCompetition外洋活体指纹检测大赛第别称。
刘云涛2019年加入公司,接洽得手机指纹防伪算法的科罚决议需要应用到好多技巧盘曲数据库,他突发奇思:为什么不奏凯把这些盘曲技巧卖给对方?
从卖本事到卖数据,刘云涛第一次尝试到数据当作一种“原材料”的价值所在,景联文也从此干涉AI数据标注行业。
尔后,景联文科技在AI数据领域连接膨胀,基于本身Solar数据工程处理平台提供AI数据集合、标注、微调、分析、挖掘等奇迹,先后获取Iso27001、Iso9001、Iso27701、DCMM认证等天禀,参与8项国度数据交换形式和数据安全模范制定。
2022年,景联文科技运行布局大模子数据奇迹赛谈,建成了完善的数据代理、分娩、清洗经过,为国内头部大模子公司提供丰富的算料。“咱们手里训导方面的题库,客岁至少60家大模子齐思要。”刘云涛说。
现在,景联文科技也在国防军事智能化领域,基于本身平台提供高效的数据处理才和解高质料数据居品。刘云涛也成了“iso外洋模范大众”和“国度模范第扫数草东谈主”。
大模子时间
数据的需求量成指数级高潮
在上海大数据定约最新发布的一份2024中国AI大模子产业图谱中,在腾讯云、阿里云、联通云等云运筹帷幄巨头扎堆中,“景联文”三个字显得有些突兀。
诳言语模子之是以概况展现出惊东谈主的连络和生成才调,是因为从海量的预实际数据中学习了丰富的天下常识。
一般而言,大模子厂商在处理数据时遵照的经过频繁包括几个门径:开首,数据从各渠谈获取被获取后,干涉数据工程部门,数据工程师会对数据进行清洗和预处理;接着,处理好的数据会被交给算法部门,算法部门会利用多种圭表进一步处理,包括调参、通过监督学习对模子进行改变,最终会被应用到具体的任务或居品中。
这中间就给景联文这么的数据公司提供了契机,他们需要作念的等于把大众的优质数据买转头处理成算料,再卖给大模子厂商。
咫尺,景联文在细分领域照旧作念到交游量前两名,何况遮盖了绝大大批头部科技公司,比如手机厂商华为、三星、腾讯、小米、阿里等。
“咫尺咱们有400个领有领域常识的标注工程师,展望在来岁将达到2000东谈主。”刘云涛先容,其实标注师一度曾经到1000多东谈主,自后因为条目变高优化了一批,“刚运行招聘的时候,条目是会用电脑就行,现在彰着照旧不适用了。”
跟着AI本事的快速发展,数据标注这个责任也在连接高质料发展迭代,只论标注东谈主员肤浅的标注面目越来越少。标注需求愈加邃密化、专科化,条目标注东谈主员应具备相应的专科常识和技能,对标注员的学历等第、话语才调、连络才调,专科常识布景的条目齐越来越高,比如话语标注团队条目会各样小语种,医疗标注需要医学院毕业的学生。
除此以外,大模子时间,算法本事的冲破带来更复杂、更大规模的数据处理需求。数据标注企业必须具备巨大的数据处理才调,包括数据平台的智能化水平、数据工程化才调、对大模子/AI算法的连络等。
景联文科技照旧从当年的纯东谈主工标注,发展为咫尺AI算法预标注加东谈主工标注审核的分娩模式,景联文数据工程平台阑珊据智能识别和自动化标注功能,能灵验裁减高质料数据的获取资本。
“数据标注公司的中枢竞争力照旧利用数据工程平台进行自动化标注,罢了降本增效,不是一家肤浅的东谈主力标注公司。”刘云涛说,公司在2022年底诱骗了北京、深圳双研发中心,就在五谈口,为的等于挖到国内更顶尖的数据工程算法东谈主才。
关于这个正生机勃勃的行业来说,故事才刚刚运行。
橙柿互动:掌持数据之后,有思过我方奏凯去作念大模子吗?
刘云涛:莫得思过。AI时间中枢三因素:数据、算法、算力,数据是成就算法的中枢因素,如何把海量的多模态数据加工收效高质料的算料,这是一个千亿的市集。咱们期待用我方数据工程平台为千行百业的科技公司带去高质料“燃料”。
橙柿互动:数据标注并不是一个行业门槛很高的领域,你们是如何作念到行业跳跃的?
刘云涛:在大部分东谈主眼里数据标注行业门槛低,在咫尺大模子时间我觉得这是一个领有高门槛的行业。咫尺数据形态多种各样,如何能把数据利用东谈主工+算法的才斡旋理成高质料算料,才调诱骗门槛。
这个领域主如果看中两个才调,一个是数据寻源才调,开首要有集合到海量的原始数据才调;第二个是数据处理才调,咱们尽头醉心从本事角度而非东谈主力角度来科罚举座数据分娩经过中存在的问题,笔据不同的客户需求来定制本事决议。
咫尺咱们自研的景联文数据工程平台包括数据处理、面目不断和数据安全管控等模块,有SAM自动预标注算法,概况罢了对图像视频、语音、文本等数据的智能识别。通过AI扶持,匡助客户大幅度裁减了数据准备时长和资本,科技公司当然会优先遴荐咱们。
橙柿互动:如何评价我方当作一个CEO的变装?
刘云涛:我是一个市集型CEO,我每年有一半的期间齐在出差和客户进行疏通,这是我制定公司场所的取胜窍门。我的底线等于率领公司活下去,背负是让公司过的更好,愿景是为中国AI科技公司提供高质料、高性价比的数据算料。这条路还很长,咱们期许与大众优秀的科技客户扫数共同探索和鼓动东谈主工智能本事的发展,成为行业中最值得信托的数据科罚决议提供商。
意志更多新质分娩力后生
九千光年俱乐部古代家庭伦理小说