区块链技术的诞生,让存储形式发生了革命性变化,从数据集中化运营管理走向了分布式自运营模式。从集中化到分布式,不仅仅是一种商业模式与思维的变化,更重要的是开启了一场具有历史意义的去中心化“商业实验”。
在科技时代的契机与趋势下,分布式存储成为点对点技术、网络存储技术、智能合约技术与计算机技术等科技学科的结合体,不仅得到了科技、金融、资本等领域企业的“情有独钟”,而且也获得了科研机构、政府部门、公益组织等职能单位的关注与重视。
现阶段我们正在逐渐全面智能化,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。但是机器如何理解人类的知识载体文字、图片和视频等一直成为其发展的挑战,如何让机器理解人类所掌握的知识,并基于已掌握的知识学习新知识,而知识图谱规模是走向全面智能化的关键一步。构建大规模知识图谱面临众多挑战,EpiK Protocol铭识协议应运而生。
EpiK铭识协议到底是怎样的?它的存在有何优点?又凭什么能够与Filecoin明星项目赛道竞技?今天我们有幸邀请到了EpiK铭识协议中国区负责人Eric,为我们掀开属于EpiK铭识协议的神秘面纱,一步一步找寻属于这些问题的答案。
01
星际视界:您好,很荣幸今天能邀请您,您在币圈的风起云涌中经历了这么久,请问您与铭识协议EpiK是怎样结缘的?请问您能为我们分享下您与铭识协议EpiK的故事么?
铭识协议Eric:大家好!我是Eric,毕业于清华大学的信息学院。由于研究的是数据存储和大数据计算方向,我进入链圈、接触到比特币的时间也比较早,从2013年起就陆陆续续投资过比特币、以太坊、瑞波币、狗狗币、EOS等等,同时也经历了每一次市场的这种跌宕起伏和牛熊转换,一直以来在行业内也是作为一个区块链早期技术型投资人和行业观察者的身份,去中心化存储也是我一直重点关注的赛道,从17年起就一直密切关注着IPFS和Filecoin的项目发展。今年年初的时候,清华的一些在行业内的伙伴找到我,他们也关注到了FIL数据质量低,资源浪费率高和无法商业化的问题,我们的一些想法不谋而合:就是如何更好的转变数据存储模式来确保链上数据价值和整个项目的商业价值,由此诞生了EpiK的想法。
02
星际视界:请问您能简单帮我们介绍下铭识协议EpiK项目以及团队么?
铭识协议Eric:首先我来为大家介绍一下项目的愿景,第四次工业革命已经来临,全面智能化是这个阶段的核心目标之一,而全面智能化的关键在于如何让机器理解人类所掌握的知识,并基于已掌握的知识学习新知识。而知识图谱规模是走向全面智能化的关键一步。为了解决大规模知识图谱的构建面临众多挑战,铭识协议应运而生。
铭识协议的全称是EpiK Protocol,其中EpiK是 Epigraphy Knowledge的缩写,代表着铭刻在石头上的知识。EpiK Protocol 致力于构建去中心化的超大规模知识图谱,通过去中心化存储技术,去中心化自治组织和通证经济模型,组织并激励全球社区成员将人类各领域知识梳理成知识图谱,共建共享并持续更新这一人类永恒知识库,从而将人工智能的视野拓展到更智能的未来。同时也希望能通过更合理的数据封装、更加宽容的惩罚措施,和E2P的数据上传模式等等来解决算力竞赛的问题,使用好当前的已有算力和资源,帮助被Filecoin抛弃的小矿工参与到分布式存储的赛道中来。
下面简单介绍下我们的项目团队,核心成员主要来自于清华大学,北京大学,新加坡国立大学,南洋工大学等高等学府,有着扎实的技术实力,也都参与或者直接主导过公链(PoW,PoC,PoS)开发,对公链的解构能力很强。现阶段我们已经把P2P存储改成E2P存储了,与Filecoin差异较大的经济模型也有了对应的技术方案,争取在12月份主网可以和大家见面。EpiK除了整合 Filecoin 存储技术之外,还要搭建 DAO 协作平台,以及知识图谱工具箱,是一个复合程度很高的工程。
03
星际视界:10月15日,Filecoin主网上线,引发众人关注,但同时,Filecoin内部分叉的呼声也从未停止过。而EpiK铭识协议便是其中之一。是出于什么样的原因,选择分叉的?
铭识协议Eric:EpiK不是一个为了分叉而分叉的项目,而是因为有需求,所以选择了Filecoin的存储技术作为整体架构的一部分,这个想法最早是今年年初的时候出现的,EpiK的项目方都是很资深的区块链行业从业者,也在一直关注着分布式存储技术的发展。我们当时萌生了 \”去中心化存储+DAO+知识图谱\” 的雏形,DAO和知识图谱的技术我们都很熟悉,但去中心化存储的选型没能直接敲定。调研了市面上主要的去中心化存储技术,PoRep 和 PoSt 是我们从技术角度认为最为硬核的解决方案,进而有了分叉 Filecoin,把其核心存储技术融入 EpiK,形成 ”IPFS + DAO + 知识图谱“ 的顶层结构。
在参考了Filecoin的底层解决方案的过程中,EpiK也看到了Filecoin在发展的过程出现的问题,并针对性的作出了改变。
04
星际视界:铭识协议EpiK项目和Filecoin本身存在什么样的区别?
铭识协议Eric:EpiK的设计和Filecoin在各方面都有着很大的不同。
EpiK 的重大改进在于对数据价值的捕获,EpiK 的目标是引导所有社区参与者共建共享各领域知识图谱数据,知识图谱数据是机器人理解人类知识的最佳方式,知识图谱数据越多,机器人掌握的知识就越多,其智能程度是指数级上升的,EpiK 采用去中心化存储技术,用线性增长的硬件成本,捕捉了指数级增长的数据价值。
首先从商业模式的角度上来看,EpiK在商业模式上更加聚焦,他所面临的市场和赛道不同于Filecoin所在的云存储市场,因为去中心化存储在存储成本和用户体验上和专业的中心化云存储相比并没有优势。EpiK专注于构建去中心化的知识图谱,在避免了知识图谱被少数人随意篡改的同时也降低了数据的冗余度、保障了分布式存储链上的数据价值,从而将整个项目的商业化落地变得合理和可行。
其次,从生态构建的角度上来看,EpiK对待矿工更友好,在很大程度上解决了Filecoin的痛点,将Filecoin的存储抵押和承诺抵押更改为一次性抵押。矿工参与铭识协议的挖矿,每个矿机只需要抵押1000 EPK,而且只需要在挖矿前抵押一次就可以,不需要在每个扇区进行抵押。
再次,EpiK有着更加宽容的惩罚机制,和Filecoin官方规定的共识惩罚、存储惩罚和合约惩罚不同,由于铭识协议只能够由领域专家上传数据,也就是“Expert to Person”的模式。每个矿工都需要备份,这就意味着如果在网络当中如果有一位或多位矿工掉线,对于网络不产生太大的影响,而因掉线而没有及时上传时空证明的矿工,仅会被官方罚没这部分扇区的有效算力,不会罚没质押币。而这部分扇区的算力被罚没也是暂时的,如矿工可以在28天之内重新提交这部分时空证明,将会重新获得该算力。
而且和Filecoin所需要的32GB扇区大小不同,EpiK封装扇区更小,每个扇区的大小仅为8M,这样会在极大程度上解决Filecoin扇区空间浪费的问题,同时所有的矿工都有机会完成快速封装,对小算力矿工是非常友好的。同时数据数据和质量上的限制也会确保大矿工和小矿工的有效算力差距将不会被拉开。
最后不同于Filecoin的P2P数据上传模式,EpiK把数据的上传和维护改为E2P上传,就是领域专家来上传和保证链上数据的质量和价值,在DAO生态当中一共有5个角色,分别是矿工、持币用户、领域专家、赏金猎人和网关,来参与到数据的产生到纠错到存储等各个环节,并且通过合理的经济模型来引入数据存储角色和数据产生角色的博弈关系,保障整个系统的稳定和链上数据持续高质量的产出。
05
星际视界:2012 年,搜索巨头谷歌就提出了知识图谱,接下来的近 10 年中,不断有巨头前赴后继,知识图谱也得以悄然壮大,人工智能也随之风生水起。然而无论是谷歌,还是其他巨头都面临的更为严峻的问题:由知识到知识图谱的构建的繁琐工作量以及存储问题。请问EpiK是如何解决这一问题的?
铭识协议Eric:对于数据存储问题,EpiK底层的分布式存储确保了数据的确权和不可篡改,在知识图谱的构建方面,EpiK搭建了三大平台,分别是知识图谱构建工具平台,去中心化协作平台和知识库应用平台,其中工具平台包含了知识获取,知识纠错,知识融合,知识存储四大模块。目的就是将这些非结构化数据加工成三元组网络,从而降低了知识的转化成本。
由于知识图谱的梳理是一个劳动密集型工作,超大规模知识图谱构建过程中,包含了多方协作,包括梳理各领域知识骨架的领域专家、帮助领域专家加工和检测数据的赏金猎人、提供存储空间的矿工、使用知识图谱的用户等等,去中心化协作平台将各方角色很好地组织起来,通过激励相容的通证经济模型激励各参与方为了自身利益最大化而持续丰富人类知识库。
06
星际视界:据了解铭识协议创建DAO的生态机制,请问在创建的生态机制中参与者的角色有哪些,彼此之间相互关系是怎样,主要的职责是什么?
铭识协议Eric:铭识协议创建DAO的生态机制,在DAO生态当中一共有5个角色,分别是矿工、持币用户、领域专家、赏金猎人和网关。
矿工负责提供底层存储,持币用户可以投票选举领域专家,投票产生的领域专家负责组织某个领域的知识梳理和知识图谱生成,赏金猎人可以领取领域专家发布的任务,帮助领域专家梳理、校验数据,从而赚取收益。网关用来对上层应用提供数据的索引和访问服务,使得数据更好的产生价值。这5个角色分配主网上线后每天产生的EPK。矿工拥有其中75%的EPK,领域专家拥有其中9%的EPK,投票用户分享其中1%的EPK。另外15%的EPK将会根据网络每日访问流量浮动,而这15%的部分是矿工和领域专家相互博弈的关系。
首先介绍这两个角色的关系。第一批领域专家由基金会选出,这些领域专家涉及知识领域不同(这里的知识领域范围很广,不仅包括严肃学科,也包括家居、美食、旅游等方面),这批领域专家可以推荐下一批领域专家,推荐的专家只需要获得10万票EPK就可以成为领域专家。
而领域专家的职责就是向矿工提交高质量的数据,矿工负责将这些数据封装进区块。网络活跃度的评判标准就在于全网为了获取每日访问流量而抵押进来的EPK占总流通量比重(1EPK=10MB/天),比例越高则说明数据需求量增大,这就要求矿工提升带宽质量。如果数据需求量降低,这就要求领域专家提供更高质量的数据。这就好比图书馆里访客多了,就需要更多的座椅,即花钱让矿工提升带宽。访客少的时候,需要更多钱购买更优质的书籍吸引访客,即给赏金猎人和领域专家去生成更多优质知识图谱数据。矿工和领域专家的博弈是生态中最重要的博弈,不同于Filecoin生态中官方和大矿工的博弈。
数据生产者和数据存储者的博弈关系和更加合理的经济模型,势必会导致E2P模式下,产生存储的链上数据质量远高于P2P模式,而数据访问的带宽质量也会好于P2P模式,从而获得更大的商业价值和更好的落地场景。
07
星际视界:据 EpiK铭识协议介绍,EpiK 采用的是 E2P 模式,即只允许投票选出的领域内专家上传数据。如果说投票选出的专家所上传的数据收集个人隐私,请问该如何控制?如果说只有投票选出的专家才能上传数据,是否意味着 EpiK铭识协议无法普及到所有人?
铭识协议Eric:对于领域专家收集个人隐私问题,EpiK的商业目标是有效组织数据共建共享创造指数级价值,有效组织的数据越多,就能形成更多的有效信息,有效信息越多,就能让决策更智能。
在数据共建共享过程中,隐私是红线的红线。所有领域专家在申请时都需要接受《EpiK领域专家承诺书》,隐私数据,错误数据,垃圾数据都是EpiK组织数据共建共享的红线,一旦有领域专家违背,就会直接被协议取消资格并接受严厉惩罚,提名该领域专家的人也会被连坐,让领域专家间形成社会监督。
EpiK铭识协议无法普及到所有人这个问题。首先我先阐述一下结论,EpiK采用的E2P模式和DAO中各个生态角色的引入会普及到更多的人。E2P模式只是对生成和存储数据的质量做了一个限定,并不是对生态中的角色做了限定,相反的,由于DAO模式的引入,EpiK生态中引入的多种多样的角色(这其中就包括普通人就可以胜任任务的赏金猎人)给所有人如何更合理的参与这个系统提供了角色和可能。
不同人根据其贡献的不同和能力的不同都可以很好的参与到这个系统中来,比如有算力的矿工可以提供存储,有一定领域知识的人可以申请成为专家(这其中包含方方面面,比如历史、科技、旅游、漫画、美食等等),愿意为数据进行标注和纠错的人可以成为赏金猎人。由于项目方的各种高效率的辅助工具出现会降低各种角色的进入门槛,从而让不同人在这个系统中各司其职,一起为持续生成高质量的去中心化知识图谱贡献力量。
08
星际视界:安全一直是人们重点关心的一个话题,在数据安全方面,EpiK铭识协议是如何保障数据安全的呢?如何保证用户隐私安全?
铭识协议Eric:底层的去中心化存储提供了数据的确权和数据的不可篡改,8MB的扇区封装和更宽容的惩罚机制降低了存储节点的准入门槛,协议中鼓励全网每份数据存储3000份,数量众多的矿工节点确保了系统和数据的安全稳定。目前我们测试网注册矿工已经突破5000台,而且每天还在以200+的速度增长,这个网络规模下,在安全性方面我们压力并不大。
EpiK强调数据分享,有组织地分享数据才能创造最大的价值,并给每个参与数据分享的用户带来收益。分享不代表侵犯隐私,比如好大夫,企查查等这些数据服务公司,他们都是有效的组织非隐私数据,估值都很高,同时领域专家也会进行数据脱敏保护原数据的隐私和版权。
09
星际视界:请问现阶段EpiK铭识协议的项目进展到哪一阶段了?近期还会有哪些大动作?
铭识协议Eric:EpiK 铭识协议的发展分为5大阶段,第一阶段测试网“方尖碑”;第二阶段主网1.0“罗塞塔”;第三阶段主网2.0“汉谟拉比”;第四阶段丰富知识图谱工具箱;第五阶段丰富知识图谱应用生态。目前处于第一阶段测试网“方尖碑”,任何人可以报名参加测试网预挖测试获得ERC20 EPK代币,主网上线后一比一兑换。
近期我们已经将ERC20 EPK上线Uniswap,大家可以在Uniswap或者下载我们EpiK手机钱包自由买卖。另外,我们已经上线EpiK Bounty平台,欢迎社区有识之士一起做任务建设EpiK社区。同时,我们也在推进中心化交易所上币事宜。