注意:使用该方法,获取的数据总数目不能超过1万,否则出错
#在python3上运行 from elasticsearch import Elasticsearch from urllib3.connectionpool import xrange def get_page_data(result): for hit in result['hits']['hits']: print(hit) if __name__=='__main__': es_host = "0.0.0.0" port = 9200 timeout = 15000 index = "gather-v10" es = Elasticsearch(hosts=es_host,port=port,timeout=timeout) # gather-v10 总条数 count = es.count(index=index)['count'] # 每页显示条数 page_line = 2 #显示多少页 if (count%page_line==0): page = (int)(count/page_line) else: page = (int)(count/page_line+1) # 要生成很大的数字序列的时候, # 用xrange会比range性能优很多, # 因为不需要一上来就开辟一块很大的内存空间。 # x = range(0,10);type(x) 是一个列表 # x1 = xrange(0,10);type(x1) 是一个生成器 xrange(0,10) for x in xrange(0,page): rs = es.search(index=index,body={ "query":{ "match_all":{} }, "from":x*page_line, "size":page_line }) get_page_data(rs)
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。