阿里云ES跨账号数据迁移(reindex)

小丫1年前技术文章715

1、背景与前置条件

总的来说,阿里云es集群间数据迁移,有三中方式,logstash、reindex、镜像备份恢复,分别使用不同的场景,本文档主要讨论reindex方式进行账号下,ES跨集群迁移时,使用reindex方式数据迁移。需满足:

A、 ES集群为同账号且是同一可用区

B、 ES集群间满足网络互通(配置实例网络互通)

C、 目标端配置自定义远程索引白名单(需重启)

2、配置实例网络互通

2.1、配置实例网络互通前置条件

为了安全性,阿里云ES实例间的网络默认是隔离的,若需要使用跨集群搜索功能,则需要将两个实例的网络进行打通。打通条件:

A、 相同版本。

B、 归属于相同账号。

C、 部署在同一个专有网络VPC(Virtual Private Cloud)中。

D、 同为单可用区实例,或同为多可用区实例。

2.2、操作步骤

A、 登录阿里云es控制台

B、 在顶部菜单栏处,选择地域。

C、 单击目标实例ID/名称链接。

D、 在左侧导航栏,单击安全配置。

E、 单击配置实例网络互通右侧的修改。

F、 在修改配置页面,单击+添加实例。

G、 在添加实例对话框中,选择需要进行网络互通的远程阿里云ES实例的ID。

image.png

3、配置自定义远程索引白名单

3.1、操作步骤

A、 登录阿里云es控制台

B、 在顶部菜单栏处,选择地域。

C、 单击目标实例ID/名称链接。

D、 在左侧导航栏,单击ES集群配置。

E、 在右测点击修改配置,输入所源集群地址:端口,并重启es集群

image.png

4、reindex数据同步操作

4.1、操作步骤

以下操作表示从源ES集群中查询名为test1的索引,查询条件为title字段为elasticsearch,将结果写入当前集群的test2索引

POST _reindex

{

"size": 5000,

"source": {

"remote": {

"host": "源端地址:9200",

"username": "源端用于名",

"password": "源端密码"

},

"index": "源端索引名",

"size": 100

},

"dest": {

"index": "目标端索引名"

}

}

备注:

A、目标端和源端索引名不需要一致,指定就好

B、目标端需要创建索引(mapping不需要创建),或者在目标集群开启自动创建索引参数(需重启)

C、第一个"size": 5000是控制整体迁移的数据量

D、第二个"size": 100是控制迁移批次(即每次迁移数据量)

4.2、迁移完成后验证

源端和目标端分别执行下面命令,对比文档数量

GET _cat/indices/index_name?v


相关文章

EMR集群主机/opt/bignode目录占用巨大并持续增长

EMR集群主机/opt/bignode目录占用巨大并持续增长

问题现象:如下qa环境集群中,master节点出现如下磁盘告警处理步骤:登陆到该节点服务器,首先定位是哪个目录占用系统盘空间较大定位是由于:/opt/bignode/blocklet_indexing...

oracle回收站简介

一、回收站简介1、概念和功能回收站从ORACLE 10g开始引入,全称叫Tablespace Recycle Bin。回收站实际是一个逻辑区域,使用的已经分配的表空间,表被drop时,数据不会实际删除...

OSS bucket权限设置

OSS bucket权限设置

问题描述调用oss的bucket资源,开始的时候可以访问,过几分钟再访问的时候,就提示拒绝访问问题原因是因为相应的bucket权限为私有,私有权限在访问文件对象时,是存在鉴权URL,存在时间有效性,所...

CDP实操--配置RangerKMS 并基于Navigator Trustee Server存储KMS密钥

CDP实操--配置RangerKMS 并基于Navigator Trustee Server存储KMS密钥

1.1添加用于部署KMS的服务器到集群从集群host页面里添加两台服务器用于部署rangerkms选择kms-1和kms-2两台服务器等待parcel分发到新加服务器上并自动完成激活 等待host i...

DDoS木马攻击处理

DDoS木马攻击处理

问题描述云安全中心提示安全告警如下:恶意脚本代码执行DDoS木马问题解决安全组方向封禁查看次访问地址205.185.119.110 地址为国外一地址,去下载恶意脚本,因此在服务器出入安全组方向做了封禁...

分布式存储-GlusterFS

分布式存储-GlusterFS

一、分布式存储介绍我们知道NAS是远程通过网络共享目录, SAN是远程通过网络共享块设备。那么分布式存储你可以看作拥有多台存储服务器连接起来的存储输出端。把这多台存储服务器的存储合起来做成一个整体再通...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。