DATAHUB 是一个提供丰富的数据和熟悉的工具给不同的你我“讲故事”地方。我们已经为您收集了大量的公开数据,例如篮球的得分数据、电影票房数据等,方便直接使用。DataHub希望每一个独立思考的灵魂能利用这些数据勾勒出更多有趣的故事,和这个世界分享。也希望数据本身能让阅读这件事情能带领读者走入更深入的思考。
提取数据(ad-hoc查询)
当我们需要一些公开数据时,往往因为信息爆炸而花费大量时间进行甄别。但在DATAHUB,我们提供最常见的提取数据工具—SQL。只需在数据工具输入简单的SQL语句,即可快速、精准的提取出您想要的数据。
通过SQL,大家可以从不同数据中自主地进行关联,从而发现一些有趣的事情,数据是客观的,我们希望能看到每个人从数据里面不同的故事。
SQL
对于数据感兴趣或者希望从事数据分析职业却无从下手的朋友可以选择 w3school 的 SQL教程
以上您已经掌握了最高频使用的SQL的语法,现在,可以开始尝试探索这个数据的世界了。
元数据
在提取数据之前,对数据进行宏观的预览是必不可少的,DataHub把这一功能放到了数据集
的明细预览
中。DataHub的每一个数据集
就是一个单独的 table,明细预览将记录对应的元数据信息以及具体数据。
同时数据的列名称将不支持使用中文进行query。
--这是无法支持的
select 得分 from 球员数据表 where 名称='Lebron James'
相对地,为了更好的使用体验,列名称都将是英文的。
--这是一条正常的SQL语句
select score from NBA_DATA where name='Lebron James'
元数据将以一下形式进行呈现
这种情况下,就能知道 table 每一列是如何使用的了。
列 | 备注 |
---|---|
game_date | 日期 |
opponent | 对阵情况 |
result | 比赛结果 |
… | … |
下载数据
目前query之后的数据下载是免费的,但query本身涉及了计算资源,由于我们不鼓励无意义的全表遍历造成的资源浪费,query将会收取一定的费用。目前DataHub有各种方式回馈早期用户,更多详情可以了解我们首页的活动。
数据故事
当您对数据有了独到的洞察和理解,您可以在数据故事模块进行分享、交流、传播。通过制作一个Dashboard,我们能使数据更直观、生动。下载数据后即可参考制作一个Dashboard。
总计0条评论