新华日报·人文周刊(第249期)
【记录】
【文脉】
数字职业,“入列”!
当前,5G、元宇宙、区块链等新兴数字技术蓄势待发,推动就业形态不断创新。近日,《中华人民共和国职业分类大典(2022年版)》,首次增加“数字职业”标识,标识了包括“人工智能培训师”“大数据分析师”“区块链工程师”等97个数字职业。
与传统职业相比,这些职业暂未成为主流,但为年轻人就业提供了新思路,成为驱动数字经济发展的中坚力量。记者近日走近从事数字职业的年轻人,倾听他们对职业成长的理解感知。
人工智能培训师:我给AI当老师
“计划停电时间为2022年11月21日8:00-12:00,当前时间符合,许可旺庭公馆#变压器检修工作。”
指挥停电声音刚落,“小艾”接到了市民报修电话。“请问您在哪个小区?”“翠岗小区”……简单交流后,“小艾”在地图上快速找到了位置,发送工单给距离最近的抢修员。
电话还没挂断,“小艾”又接到了咨询。“我在抢修现场,客户问增容业务怎么办理。”“请问是住宅用房还是营业用房?”……
接受服务咨询、指挥配变检修、发布故障信息……在国网扬州供电公司的服务大厅,人工智能机器人“小艾”有条不紊地忙碌着,“以往二十多人搞定的事情,现在‘小艾’一个人就完成了,她是我们部门的‘智慧担当’!”作为人工智能培训师,徐力俨然一位骄傲的“老父亲”,语气里满是“吾家有女初长成”的欣慰。
“人工智能就像小孩子,要不断训练,‘智商’才会越来越高。”徐力的日常工作,是在计算机上敲入一行行代码,这些代码构成模型,模型通过学习各种各样的数据,形成和人一样的判断力,“简而言之,就是给‘小艾’‘喂数据’,通过不断认知思考,‘小艾’识别准确率越来越高,会迅速成长。”
“以前3人轮巡扬州100多家营业厅,每家营业厅最多逗留几分钟,现在这项工作被‘小艾’取代了。”徐力很骄傲。
在徐力工位上,两台电脑正在“跑数据”,一排排矩阵、代码、公式布满屏幕,徐力向记者演示了教“小艾”“辨别手机”的过程:他用标注工具将图片中的手机逐一圈出,标注为“iPhone”,这些标好的图片被送进数据库,“喂”给“小艾”学习,然后逐张测试识别结果是否正确。起初,“小艾”还会将图片里的计算器、手表误判成“手机”,徐力将算法调优后,再进行迭代训练……
“一个算法模型的训练,少则要5000-10000张图片数据,但识别类算法,比如人脸识别,往往需要几万张甚至几十万张的图片数据。标注常常要七八个小时,很考验人的耐心。”徐力说。
如今,疫情防控常态化,公共场所的监管更不能松懈,“小艾”也变得愈发忙碌,在营业厅办理业务必须佩戴口罩,人与人之间保持一米距离,这些“小艾”都能全天候监测识别。
回看过去几年,徐力庆幸自己“眼光”好。2011年大学毕业后,徐力成为国网扬州供电公司的一名配电运检师,负责线路运维和抢修的工作,那时候,人工智能技术在国内刚刚兴起,徐力瞄准这一“风口”,开始跨界自学,从算法到建模再到应用场景的设计,不断积累经验。
这些年,在质疑中发展的人工智能,从投资者口中的热词,渐渐变成了实实在在的设施,应用在政务服务、金融以及电力等领域。
每年扬州都有不少停电检修工作,但是调管范围内,开关设备有2万多台,配电变压器有1万多台,如果单纯依靠人工调度,平均每天都要耗费大量人力。人工智能能否介入?怎么介入?接到任务之初,徐力一度陷入焦虑,他一边研发,一边学习摸索,常常通宵达旦,“半个多月内,我们不断推翻重建思路,调整了20多个版本,才最终实现。”
徐力觉得技术攻关就和打游戏一样,如果被打败就回血蓄力,再战一回,如果战胜了,就能打开新局面。四年多来,徐力在“打怪”的路上,披荆斩棘,营配网格、虚拟抢修指挥员、全资源指挥地图……这些人工智能应用项目,徐力都“经手”过。
近日,人社部发布的数字职业中,“人工智能培训师”赫然在列,这一称谓的面世,让徐力多了份“转正”的喜悦。他认为,人工智能培训师是复合型人才,不仅要了解算法调优、数据标注等技术知识,更要熟识垂直应用的行业。最近,徐力愈发有紧迫感,他打算攻读数字图像处理方向的研究生。他说,人工智能由人类创造,由人类推动,作为人工智能培训师,要更好辅助地优化他们,让他们为人类所用。
大数据分析师:数据会说话
“在这里,上一秒还是创意火花,下一秒可能变成应用产品。”11月28日上午9:30,夏龙龙准时到工位上,他按下电源键,戴上耳机,手指不停敲着键盘,伴随着清脆的“噼里啪啦”声,一连串算法语言向上滚动。“10:30有个线上会议。”夏龙龙说着,换上另一副专门开会的耳机,和同事们聊起项目进度。“聚类分析”“模糊逻辑”等专业术语不断输出,一排排矩阵、代码、公式布满了屏幕……
夏龙龙是小视科技江苏股份有限公司的一名大数据工程师,95后的他已经在这个行业干了5年,有着超越同龄人的成熟。从大学开始,夏龙龙就习惯了与数据打交道,如今工作中的数据采集、数据分析对他来说,早已轻车熟路。
对于大数据分析师而言,数据处理是基本功,夏龙龙介绍说,“初始数据量大,价值密度低,先要对这些数据进行清洗,然后构建模型,在目前的算力条件下,尽可能提升建模准确度,常常要进行上百次测试。”他告诉记者,这就像用“数据”剪裁一件衣服,工程师要选择合适的数据做“布料”,最优的模型出“设计图”,再比照现实修改尺寸。
“核验通过,请通行!”智能语音响起,南京市江宁区小里新寓门禁闸机自动开启。今年5月份起,该小区的出入口就布设了防疫“数字哨兵”,居民刷身份证、刷人脸,能直接看到健康情况,人员流动的信息,清晰地呈现在物业管理办公室的监控大屏上。
“小里新寓常住居民有2000多人,平均每天通行数据达2万多条。”夏龙龙说,这些通行数据会说话,根据通行时间、频率以及习惯,能生成个人通行模型曲线,一旦发现严重的偏差,系统会告警。他们利用这种方式实现对社区“重点人群”的关注。
11月26日,在小视科技ITAS智慧物联应用系统上,跳出了一条告警信息,住在江宁小里新寓3幢77岁的独居老人黎宇已连续三天没有出入信息,“黎大爷出行向来规律,最近三个月他平均每天出行两次,分别在上午8点左右、下午5点左右。”夏龙龙将这一情况反馈给社区,网格员上门查看后,发现原来是黎大爷在家不小心摔倒了,不想打扰儿子,便忍了两天没有出门,最终在社区人员的帮助下,黎大爷顺利就医。
“独居老人是社区重点关注的对象,如果他们的出行频次或者习惯突然改变,就有可能存在安全隐患。”通过分析通行大数据,夏龙龙还发现过传销组织的苗头,“这部分群体喜欢在非上班时间尤其是半夜结伴出行”,夏龙龙说,两年多以来,仅在小里新寓,发生类似的告警事件就有30多起。
由数据推演出的模型,在海量数据中反复验证,模型也随之调整。智慧社区项目实施之初,闹了很多乌龙,有一次,夏龙龙注意到,一位独居老人连续两天没有出行数据,调查发现,原来老人的儿子就住在隔壁楼栋,不需要经过门闸通行。还有一次,一个房间注册了20多人,以为是群租房或传销组织,后来发现是物业保洁人员的公共休息室。这些乌龙事件,也督促夏龙龙在数据模型中要考虑得更谨慎更周到。
通过数据建模,敲下的一行行代码不断演变成智能化应用场景,这是夏龙龙最有成就感的事情。“我们最新的研究主要集中在智慧社区。比如,高空抛物摄像机,能记录下高空抛物全过程,直接锁定楼层和户主;智能监控设备,能识别可疑人员翻墙‘入侵’小区,识别道路上是否有老人和孩子跌倒,查看车辆停放占用消防通道和居民遛狗不牵绳的情况。如有异常,系统会第一时间发出预警。”夏龙龙说。
写代码、改方案、赶进度、修Bug......大数据应用模式的迭代速度非常快,考验着大数据分析师知识结构的更新能力。海量级别数据怎么处理?数据并行如何优化操作?夏龙龙经常要利用下班时间充电,他的工位看起来,更像是学生的课桌,《精益数据分析》《利用Python进行数据分析》《Python大数据分析与机器学习商业案例实战》《数据分析:企业的贤内助》等书堆成一摞摞,便于他随时查阅,找补知识盲点。
大数据行业不以经验为王,每个人都如同闯关者,处在同一起跑线上,只有不停“深度学习”,才能把未来牢牢抓在自己手里,夏龙龙说,“不断提高的实力,就是对抗焦虑、迎接未来最强劲的底气。”
区块链工程师:打造互联网“信任机器”
扫描大米包装袋上的二维码,不仅能看到溯源信息、检测报告,还能看到大米的生长环境,从育秧、插秧到抽穗、采收等全过程。这些信息是种植户对田间作物拍照“打卡”后,“一键上链”完成的。
“目前,我们农产品质量安全区块链追溯平台,在盐城响水、徐州丰县、宿迁泗洪、无锡华西村等多地投入使用,总服务面积有将近10万亩。”在江苏省农科院,农业区块链产业研究院院长卞立平兴致勃勃地给我们演示,语气中满是骄傲和欣慰。
1985年出生的卞立平是土生土长的南京小伙儿,受家庭影响,他从小就接触互联网,小学时,跟着父亲和堂哥学习计算机技术和Pascal语言,本科毕业后,他考取了南京农业大学农业信息化专业的研究生。从转行互联网到如今成为区块链领域的“资深玩家”,卞立平觉得探索过程就像是打游戏,一步步通关升级,才有了今天的“账号”。
2017年,卞立平第一次试水区块链,第二年,他带领团队研发“农业区块链”平台,并顺利申请到江苏省农业科技自主创新资金,从此“迷”上了区块链。
“区块链的本质,是构建互联网上的信任制度。”作为传统的理工男,卞立平有些腼腆,但聊起区块链,他侃侃而谈:区块链平台为农业产供销的企业提供一份日志,每人都可以自由记录信息,相当于每一步操作,都有人在“记账”。相较于传统的生产管理和追溯系统,数据上链后是不可篡改的。“一旦有人私自篡改数据,便会造成数据失真,整条溯源信息链将失效,区块链能有效解决数据造假这个痛点,打造消费者‘看得见的信任’。”
与传统软件不同,区块链是开放的环境,没有现成的经验可以借鉴,全靠工程师自己摸索。卞立平带领团队从零起步,研究区块链底层原理,和溯源目标相结合,反反复复不厌其烦地试验,碰壁是常有的事儿。起初,卞立平常对应用场景感到迷茫,好几次,弄好的东西要全部推倒重来。但他坚信,在看似单调的一行行代码背后,他们能构建好一个新的世界。
如今,作为互联网最前沿技术,区块链已然站上了时代的风口,为各行业带来颠覆性的改变。如何不让自己掉下风口?坚持学习和思考,创新突围是唯一的路径。
去年,卞立平创造性地提出了农产品碳排放溯源数字标签的概念,将区块链与农业生产碳排放结合,对碳排放量进行精准动态数字化评估。“比如说水稻,整个生产过程需要投入农药、肥料、机械、用能等等,我们先界定核算边界,再根据LCA模型,在链上计算出种植流通各环节的碳排放量,便可以对碳足迹进行全程监测与精准管理。”
“农业企业根据这套系统,调整生产管理方式,达到节约碳排放的目的,同时,通过追溯一个农产品从生产到餐桌全生命周期的碳排放量,我们可以精准辨别,这个农产品属于低碳产品,还是耗能产品。”卞立平期待通过数字标签,推动低碳农产品走出国门,走向国际市场。
好东西要用起来,才有意义。区块链技术最大的痛点在于变现,有着八年一线农业生产管理经验的卞立平深谙此理,他用脚步不断地缩短概念和应用的距离。这几年,卞立平几乎踏遍了省内外数十家大大小小的农业园区,面对面与农场主交流,了解他们生产计划,针对每个建议分析改进,“光是碳排放的项目,大大小小的版本,就更新了一百多次。”
在卞立平看来,区块链技术的加持,为传统行业创造出了新的赛道和机会,目前,他正在中国药科大学攻读博士学位,尝试将区块链技术融入到中药材的产业发展中。作为一名区块链领域的先行者,卞立平希望更多年轻人能加入,迄今为止,他所在的团队已为土耳其、越南、巴基斯坦等40多个“一带一路”国家提供免费培训,帮助更多有志于区块链的开发者实现从0到1的蜕变。
卞立平希望,区块链技术的浪潮能席卷全球,因为他觉得,这是一项“有温度”“有人情味”的科技,“区块链技术不可伪造、公开透明、全程留痕的特性,能让人与人在互联网连接中,重拾信任和温情。”
新华日报·交汇点记者 周娴
江苏文脉整理研究与传播工程追踪②
《江苏文库·史料编》:已收录1061种文献,“最江苏”的文化记忆
历史是记载和解释一系列人类活动进程的一门学科。《江苏文库·史料编》全面调查、系统整理江苏曾经的历史书写,以更好地继承江苏文化遗产,传承江苏文脉精神。近日,记者采访《史料编》主编及编纂团队,了解《史料编》的进程、目标及编纂背后的故事。
进程:影印出版221册收录文献1061种
《江苏文库·史料编》的主编为知名历史学家、南京大学人文社会科学荣誉资深教授茅家琦和南京师范大学文学院研究员江庆柏。
据江庆柏介绍,按照规划,《江苏文库·史料编》计划影印出版500册,收录古籍文献2700余种,是从已经掌握的6000余种江苏地方文献中精心挑选出来的,内容涵盖历史、地理、政治、社会、家族、经济、教育、科举、人物、语言、艺术、宗教、藏书等各方面。截止到目前,《江苏文库·史料编》已影印出版221册,收录文献1061种。历史类和地理类已完成出版计划,其他门类正在紧锣密鼓有序推进。明年,《史料编》计划出版社会类(2022年未出版完成部分)、家族类、经济类。
虽然《史料编》的目录已基本确定,但江庆柏表示,团队还会继续搜集珍稀文献,比如今年在徐州市东方文献收藏研究中心寻访到了10余种珍贵的徐州地区史料文献,拟收入《史料编》,以弥补徐州因战争水患而文献留存较少的遗憾。
《史料编》的收录原则是什么呢?
据江庆柏介绍,主要收录独立成册的图书,酌收少量与江苏地情有重要关系,或有一定代表性的未成书册页或析出文献(从著作或公开发表的书籍文章中分析出来所获得的文献资料)。家谱、期刊、舆图、拓片、档册、政府公报等类型的文献中少量与江苏地情有重要关系,或有一定代表性的文献,酌予收取。
从时间来看,主要收录清宣统三年(1911年,含)之前出版、或形成的文献,1912年—1949年9月30日期间出版或形成的文献,择取重要的收录。
从地域来看,尽量注意全省范围内的平衡。同类文献,在不影响内容的情况下,尽量选择文献存量较少地区的文献。
凡是收录的图书,每种都撰写一篇七八百字简明扼要的提要,由书名项、作者小传、著作介绍三部分构成,提要特别注意突出该书的地域性特点。
团队:组织20多名专家的编写组
编纂《江苏文库》需要有怎样的“前期准备”呢?《史料编》副主编之一、徐州工程学院人文学院院长薛以伟教授告诉记者:“有两个重要的基础性工作必须预先完成。一个是编纂《江苏艺文志》,摸清楚历代江苏人写了哪些书;另一个是编纂《江苏地方文献书目》,搞清楚有哪些写江苏的书。省内外一批地方文史研究学者,经过十多年的努力,2013年出版了《江苏地方文献书目》(2021年改书名为《江苏地方文献志》,收入《江苏文库·书目编》),著录专门记述江苏的书6000余种;2019年出版了《江苏艺文志》(增订本),共著录江苏籍作家29617人,著作85309种。这两部书目基本摸清了江苏文献史料的‘家底’,为编纂出版《江苏文库》打下了坚实的线索基础。”作为一个文史研究学者,薛以伟担任了《江苏地方文献书目》副主编,也承担了《江苏艺文志·徐州卷》增订撰写任务。
参与《史料编》编纂的团队成员有哪些呢?《江苏文库·史料编》副主编之一、常熟理工学院曹培根教授告诉记者,课题组以省内地方高校、地方公共图书馆为基础,组织了20余位专家的编写组。“编写组成员来自南京师范大学、江苏大学、淮阴师范学院、江苏理工学院、徐州工程学院等省内地方高校,以及南京、镇江、常州、无锡、苏州等地图书馆,包括地方志办公室、科院所、出版社等文化单位。”曹培根说。
对于一些特殊的文献,课题组还聘请相关专家撰写提要,如聘请中国科学院图书馆、北京师范大学图书馆、南昌大学人文学院、苏州市地方志办公室、淮安区图书馆等单位的研究学者为特约撰稿人。
特点:史料丰富、地域性强,发现不少珍稀文献
《史料编》有哪些特点?薛以伟告诉记者,首先是史料汇辑的丰富性。
《史料编》主要展现江苏大地从古代到近代重要的历史,如汉赵晔撰《吴越春秋》,是一部记述春秋战国时期吴、越两国史事为主的史学著作;宋龙衮撰《江南野史》,为记录南唐至宋初江南史事的纪传体史书;上海共和书局编辑《江浙大战记》,记录近代史的江浙之间的战争;还有专门反映明清易代的史料,如清顾苓撰《金陵野钞》、清季承禹撰《乙酉纪事》、清王秀楚记《扬州十日记》;记载太平天国战争的史料,如清樗园退叟撰《两江纪略》、佚名辑《江宁破城记》、清解涟撰《遭乱纪略》。
其次是地方文化的独特性。《史料编》特别关注江苏人的乡土记忆,收录了大量展示江苏各地风景名胜、风土人情和生活图景的图书文献,以了解江苏的地域文化,讲好江苏故事,传承江苏文脉。如“地理类”中的方志、乡镇坊巷、山水名胜古迹、园林楼阁、祠庙寺观、游览指南、掌故杂记等;“社会类”中的社会生活、社会组织、会馆、同乡会、复社、南社、社会救济与慈善事业、民风民俗等,这些都“最江苏”的文化记忆。
三是古籍文献的珍稀性。《史料编》收录了大量稿本、抄本、孤本,都是反映江苏历史文化的珍贵稀有的古籍文献,有很多是不见于馆藏书目的,而对研究江苏地方文化却有很高价值。如苏州图书馆藏清徐立方撰《雪烦山房日记》(稿本)、淮安市淮安区图书馆藏段朝端著《楚台见闻录》(抄本)。
据曹培根介绍,许多入选史料都是团队成员在不断寻访过程中新发现的文献,也有不少是地方文史研究专家提供给我们的。比如在常州图书馆古籍部所见《毗陵二十四孝图说》《保婴保节局收支清册》《武进荫沙义渡总局征信录》,在扬州图书馆所见清王豫纂《瓜洲志稿》、清谈怡曾撰《扬州咏古五排诗钞》、清施际云辑汪鋆绘图《扬州城东八景图及图说》《扬州百咏拟望江南》等都是十分罕见的地方文献。又比如镇江市图书馆给我们课题组提供了孤本《续顺江洲志草稿》;东台市党史办(方志办)给我们提供了稀见东台地方文献二十余种,其中有不少稿抄本,属于孤本。再比如上海私人收藏家给我们提供了抄本《南溪草堂诗略》;无锡文史研究专家钱江先生给我们提供了《滨湖民国民间笔据汇存》,全部是当年立下的字据原件。
“不少是从来没有刊刻出版的稿抄本,保留着文献产生时的原始状态,更直接反映了当时的社会状况。”曹培根说。例如,上海图书馆藏清顺治六年(1649)常熟薛维岩(号隐盦)稿本《启祯两朝常熟实录补编》一卷2册,卷端书名下注“天启四年起,至崇祯十七年”,其中,记崇祯十七年三月事道:“三月十九日,流贼李自成陷都城,帝崩。五月二十二日,报闻到县,地方文武官员、军民耆老人等,哭临如礼。呜呼!帝之功德于是讫矣。编年纪事亦于是讫矣。甲申以后之事,阙而不书,遵功令也。”这是当时真实语境下的实录。
薛以伟还向记者讲述了一个故事:“王宣瑞先生是徐州市东方文献收藏研究中心的负责人,只要有徐州古籍文献方面的信息,都会第一时间告诉我。《胡打算》讲述一个农村妇女胡氏做梦发财的故事,是民间艺人说唱的脚本,融入了苏北地区的历史文化和民俗风情。《胡打算》的抄本和油印本有10多个版本,我们想找一个较早的刻本。当我把这个愿望告诉王先生,他找了好几天,终于找到了一个清刻本,这是目前所知最早、最好的版本。”他们还一起开车去过安徽宿州寻访到了《考字奇本十三韵》(《徐州十三韵》),也被收入《史料编》。
“《史料编》团队努力把江苏文脉史料展示出来,传承下去,把江苏史料中蕴含的精神标识和具有当代价值、世界意义的文化精髓提炼出来,服务当代,为实现中华民族伟大复兴提供精神力量。”曹培根说。
新华日报·交汇点记者 杨民仆
编辑: 王慧
{{ article.sysDisTopic }} {{ article.title }}
{{article.sysDisTopic}} {{article.title}}
“数字职业”