阅读: 2023/2/20 10:17:44
每个人打开自己的PC、笔记本或者手机,都能够找到带这些后缀的文件:TIFF、PNG、ZIP、GIF、PDF 、MP3……这些人们习以为常的技术,都离不开他在四十多年前的开创新研究。有效的节约数据存储和传输所需的资源,极大的促进了互联网的发展,至今人们依然从中受惠,这是对他历史性贡献的最好证明。2023年2月5日,Abraham Lempel 与世长辞,享年86岁。
Abraham Lempel(阿伯拉罕·莱姆佩尔)是以色列计算机科学家,因他与Jacob Ziv 一同提出的Lempel-Ziv压缩算法而闻名于世。Abraham Lempel于1936年出生于波兰,后来移民以色列,在以色列理工学院获得了博士学位,并留校担任电气工程和计算机科学教授,并在1981年至1984年期间担任 Taub 计算机科学学院院长。1993年,他受聘于惠普公司,一年后在以色列建立了第一家计算及实验室,直到2007年,该公司以他的名义在美国共注册了八项专利。
在1976年至1978年发表的三篇基础性论文中, Lempel和 Ziv 开发了一种被称为LZ77 的数据压缩算法,这是第一种使用字典数据的算法,因为其极高的压缩效率和无损特性,且无需事先了解数据的统计属性,被广泛应用于信息技术的各个领域,对于提高数据存储和数据传输的效率作出了重大贡献,从那时起,LZ算法及其衍生产品 成为使用最广泛的数据压缩方案。
Abraham Lempel (右)和 Jacob Ziv (左)
图源:以色列理工学院
无损数据压缩算法工作原理是,任何非随机文件都包含重复信息,这些信息可以通过使用统计建模技术来浓缩,从而确定字符或短语出现的概率。然后可以使用这些统计模型根据发生概率为特定字符或短语生成代码,并未最常见的数据分配最短的代码。这些技术包括熵编码法、游程编码和使用字典进行压缩。使用这些技术和其他技术,一个8位字符或这种字符的字符串可以用几位表示,从而删除大量冗余数据。
如果人们觉得在使用56K调制解调器上网、用500M硬盘存储的时代,数据的压缩很重要,而现在千兆光纤入户、1T硬盘标配的年代,压不压缩好像就不再重要了,这是很大的误解。根据2020年的不完全估计:
每天有10亿人打开微信,至少发布1亿条视频内容;
淘宝每天产生的数据量是50T;
推特发送5亿条推文;
发送2940亿封电子邮件;
在Facebook上创建了4 PB的数据,其中包含3.5亿的照片以及1亿小时的视频;
在WhatsApp上发送了650亿条消息;
可穿戴设备产生28PB的数据;
Instagram 分享了9500万个照片和视频;
韦伯望远镜拍摄的照片一张都有几十G;
……
存储和传输技术虽然在不断发展,但是相比于人类制造大量“有的没的”数据的能力,怕是永远都不太够用。随着时间的推移,Lempel 的发明更加凸显出巨大的价值。
除了LZ77之外,Lempel还为多个领域的研究做出了重要贡献,包括字符串匹配、无损数据压缩、随机游走、算法信息理论等方面。1998年,他获得了由IEEE信息理论学会颁发的技术创新金禧奖以及2007年IEEE Richard W. Hamming奖,以表彰他在“数据压缩方面的开创性工作,特别是Lempel-Ziv算法”。
参考文献:
https://www.ynetnews.com/business/article/hjdfzoa2o
转自:“知社学术圈”微信公众号
如有侵权,请联系本站删除!