的阿里向何地,苏报谭丨

原标题:Jupyter Notebook的三大短板,都被这个新工具补齐了

原标题:张勇接棒,“逍遥子”的阿里向何方?

原标题:苏报谭丨“桂花分”窘境折射数据共享之难

夏乙 发自 凹非寺

图片 1

苏 报 谭

在机器学习和数据科学领域,Jupyter已经家喻户晓。它把笔记、代码、图表、注释融合在一个交互式的笔记本里,还能添加各种扩展功能。可谓机器学习入门进阶研究之神器。

昨天,阿里巴巴集团创始人马云发出题为“教师节快乐”的公开信宣布:一年后的阿里巴巴20周年之际,即2019年9月10日,他将不再担任集团董事局主席,届时由现任集团CEO张勇接任。马云未来专注公益、教育,助力中小企业,年轻人和女性发展。

2018年9月11日

图片 2

马云曾戏言,“天不怕地不怕就怕CFO做CEO”。不过,张勇正是CFO出身。从CFO到CEO,仅仅多了一“横”,但是这一横很长也很难,不仅仅是权力,很可能是一个企业的命运。

星期二

可是,神器也有短板

一年后,张勇将从马云手中全面接过阿里巴巴,成为这个市值4000多亿美元商业帝国的新掌门。

戊戌年八月初二

  • 文件是固定的JSON格式,体积还非常大;
  • 要在浏览器里编辑文档好烦,好怀念自己喜欢的编辑器;
  • 版本控制好艰难,想用标准的合并工具来协作,可是人家只支持文本!

如今,阿里巴巴对于绝大多数人的生活都有着不可忽视的影响,因而大家对于这个马云选中的接班人非常好奇和关心,目前仍有很多疑问需要解答:

机关的服务效率如何提升,一句话,就是要让信息的多跑路来换取群众的少跑腿。而所谓的信息多跑路,就是要实现部门数据之间的互联互通,而这说起来容易做起来并不易。一定要跳出体制机制和观念上的窠臼,克服这种“数据的小农意识”。

最近推出的一个工具,帮Jupyter Notebook把这些短板补齐了。

张勇到底是谁?

□ 苏报评论员 杨仲

这个工具叫Jupytext,顾名思义,能够把Jupyter
Notebook的内容转化成纯文本,用你最顺手的IDE打开。

他在阿里做了什么?

近日,《苏州日报》上一篇有关桂花分的深度报道引发关注。2016年初,苏州率先在全国推出市民信用分,并且亲切地以苏州市花——桂花命名。目前,桂花分体系归集了1300多万人口的2.87亿条个人数据,作为一个个人信用信息交换、共享和应用的平台,桂花分体系也正发挥着越来越重要的作用。不过,几年过去了,记者调查发现,目前桂花分也在遭遇三难困境,除了难计算——个人信用只加分不减分和难兑现——信用代码应用场景偏少外,桂花分还受到数据瓶颈的影响。

图片 3

马云为何选中了他?

图片 4

于是,编辑协作版本控制等一系列问题,迎刃而解。

他主导的阿里巴巴将会

理论上,桂花分设计了刑事犯罪记录、交通违章记录、逾期付款记录、偷税漏税记录等22大类243个评分指标项,但真正实施起来,能被称之为个人信用指标的数据非常有限。

Jupytext现在支持的语言还不能覆盖Jupyter
Notebook的全部,但搞定了最流行的几种。它支持Jupyter
Notebook和下面这些格式之间的相互转换:

如何影响大家的生活?

通过大数据分析,形成个人信用画像,然后再依据这个客观标准进行应用。可以说,加分或减分,允许或禁止,奖励或惩戒,这些应用都是以全面、立体而精准的数据为基础,如果数据很有限,甚至数据本身存在偏差,直接导致的就是结果无法运用。倘若这样,信用体系建设的设想再好,那终究也只是看起来很美。

Julia脚本(.jl)、Python脚本(.py)、R脚本(.R)、Markdown文件(.md)、R
Markdown文件(.Rmd)。

……

图片 5

Jupytext作者Marc
Wouts在一篇博客里展示了怎样借助这个工具在IDE或者编辑器里来编辑Jupyter
Notebook、进行版本控制。

今天,粤商君将与你共同探讨。

在大数据时代,数据的交换和共享在技术上是可行和可能的,所以,真正的难点不在技术本身。据业内人士分析,由于对于个人信息的使用,目前尚无明确的法规,政府部门对个人信用数据的共享特别谨慎。

上面就是Jupytext使用过程的一个例子:把一个Jupyter
Notebook存储为.ipynb和.py两种文件格式、用PyCharm打开.py脚本来修改代码、保存之后刷新浏览器,就能在Jupyter
Notebook里看到新结果了。

接班者张勇是何方神圣?

图片 6

想要在一大堆代码和笔记里查找内容、编辑、执行cell、debug……用IDE比用Jupyter
Notebook要方便得多。

01

老实说,桂花分面临的数据瓶颈是政府部门信息交换和共享中存在的一种典型问题。在以往,从全国范围来看,一些办事窗口,群众办一件小事可能要跑断腿,甚至出现各种“奇葩证明”的滑稽。说到底,部门之间的信息割裂使然。机关的服务效率如何提升,一句话,就是要用信息的多跑路来换取群众的少跑腿。而所谓的信息多跑路,就是要实现部门数据之间的互联互通,而这说起来容易做起来并不易。

图片 7

1972年出生的张勇毕业于上海财经大学。2007年加入阿里巴巴集团之前,张勇曾任上海普华永道部门经理,2005年加盟网游公司盛大,历任财务总监、副总裁兼首席财务官(CFO)。

对于单个部门来说,内部系统的数字化、网络化,包括个人与部门之间的数据交换不仅有,而且应该相对完善。但长期以来,信息的各自为政已经成为一种思维惯性,一定要跳出体制机制和观念上的窠臼,克服这种“数据的小农意识”。做到这一点,不仅需要时日,还需要拿出魄力。加上,数据的共享本身也是新生事物,究竟哪些可以共享?共享到什么程度?依据在哪里?这些界定的模糊也往往会让一些部门趋向保守谨慎,缺乏迈开步子的勇气,动不动拿保密和隐私说事。

上图则是对文本执行版本检查,然后将有意义的差异合并的过程。

图片 8

图片 9

发表评论

电子邮件地址不会被公开。 必填项已用*标注