快速上手¶
Datahub相关的基本概念¶
详情参见 DataHub基本概念 。
准备工作¶
- 访问DataHub服务需要使用阿里云认证账号,需要提供阿里云accessId及accessKey。 同时需要提供可访问的DataHub服务地址。
- 登陆 Datahub WebConsole页面 ,创建Project
日志信息¶
可以在自己的代码中设置日志的输出和打印级别,sdk中主要包含一些debug日志和error日志,以下是将sdk的DEBUG日志打印到控制台的配置样例
import logging
logger = logging.getLogger('datahub')
sh = logging.StreamHandler()
sh.setLevel(logging.DEBUG)
logger.addHandler(sh)
初始化DataHub对象¶
Datahub Python SDK提供的所有API接口均由 datahub.DataHub
类实现,所以第一步就是初始化一个DataHub对象。
可选项:支持protobuf传输,主要在put/get record时,使用protobuf协议。Datahub版本未支持protobuf时需要手动指定enable_pb为False
from datahub import DataHub
access_id = ***your access id***
access_key = ***your access key***
endpoint = ***your datahub server endpoint***
dh = DataHub(access_id, access_key, endpoint, enable_pb=False) # Json mode: for datahub server version <= 2.11
dh = DataHub(access_id, access_key, endpoint) # Use protobuf when put/get record, for datahub server version > 2.11
dh = DataHub(access_id, access_key, endpoint, compress_format=CompressFormat.LZ4) # use lz4 compression when put/get record
更多详细定义: DataHub
接口示例¶
针对常用接口分别给出以下示例: