阿里云ES跨账号数据迁移(reindex)

小丫2年前技术文章1517

1、背景与前置条件

总的来说,阿里云es集群间数据迁移,有三中方式,logstash、reindex、镜像备份恢复,分别使用不同的场景,本文档主要讨论reindex方式进行账号下,ES跨集群迁移时,使用reindex方式数据迁移。需满足:

A、 ES集群为同账号且是同一可用区

B、 ES集群间满足网络互通(配置实例网络互通)

C、 目标端配置自定义远程索引白名单(需重启)

2、配置实例网络互通

2.1、配置实例网络互通前置条件

为了安全性,阿里云ES实例间的网络默认是隔离的,若需要使用跨集群搜索功能,则需要将两个实例的网络进行打通。打通条件:

A、 相同版本。

B、 归属于相同账号。

C、 部署在同一个专有网络VPC(Virtual Private Cloud)中。

D、 同为单可用区实例,或同为多可用区实例。

2.2、操作步骤

A、 登录阿里云es控制台

B、 在顶部菜单栏处,选择地域。

C、 单击目标实例ID/名称链接。

D、 在左侧导航栏,单击安全配置。

E、 单击配置实例网络互通右侧的修改。

F、 在修改配置页面,单击+添加实例。

G、 在添加实例对话框中,选择需要进行网络互通的远程阿里云ES实例的ID。

image.png

3、配置自定义远程索引白名单

3.1、操作步骤

A、 登录阿里云es控制台

B、 在顶部菜单栏处,选择地域。

C、 单击目标实例ID/名称链接。

D、 在左侧导航栏,单击ES集群配置。

E、 在右测点击修改配置,输入所源集群地址:端口,并重启es集群

image.png

4、reindex数据同步操作

4.1、操作步骤

以下操作表示从源ES集群中查询名为test1的索引,查询条件为title字段为elasticsearch,将结果写入当前集群的test2索引

POST _reindex

{

"size": 5000,

"source": {

"remote": {

"host": "源端地址:9200",

"username": "源端用于名",

"password": "源端密码"

},

"index": "源端索引名",

"size": 100

},

"dest": {

"index": "目标端索引名"

}

}

备注:

A、目标端和源端索引名不需要一致,指定就好

B、目标端需要创建索引(mapping不需要创建),或者在目标集群开启自动创建索引参数(需重启)

C、第一个"size": 5000是控制整体迁移的数据量

D、第二个"size": 100是控制迁移批次(即每次迁移数据量)

4.2、迁移完成后验证

源端和目标端分别执行下面命令,对比文档数量

GET _cat/indices/index_name?v


相关文章

Ansible自动化运维平台部署

一、部署前准备部署机器准备计算机名解析关闭防火墙、selinux时间同步软件包获得ssh免密登陆约定事项:所有服务器全部采用静态ip主机名称IP地址manage01192.168.98.200/24n...

借助cwRsync工具迁移

借助cwRsync工具迁移

服务端安装服务端软件如下,会自动在系统内创建一个系统用户,用户名为:xxx  ,密码为:xxx查看系统用户,会发现自动创建了如下用户:修改配置文件:rsyncd.confuse chroot = fa...

harbor数据迁移-SOP

harbor数据迁移-SOP

背景线下自建harbor需要迁移至云上自建harbor迁移方案harbor私有仓库的主从复制实现数据迁移前置条件harbor目标仓库已部署好,并且版本和源仓库版本最好保持一致迁移步骤1、配置slave...

SQL Server优化入门系列(五)—— SQL Server的执行计划

SQL Server优化入门系列(五)—— SQL Server的执行计划

定位到TOP SQL后,怎么优化呢?我们需要分析SQL的执行计划,制定相应的优化策略。这篇文章中,我们将介绍查看SQL Server执行计划的几种方法。本文测试案例中使用了AdventureWorks...

rds pg10 ssd云盘升级磁盘类型方案

rds pg10 ssd云盘升级磁盘类型方案

1、升级方案一原实例变更配置方案优缺点:优点:操作方便,升级后能保证数据和存储过程都是正常的。缺点:停机时间较长,整个变更配置期间业务不可用。变更步骤参考:在配置信息区域单击变更配置。(仅包年包月实例...

大数据平台袋鼠云托管运维与自建集群运维对比

对比维度袋鼠云托管运维自建hadoop集群运维成本根据业务需求定制架构,预估业务增涨合理规划,低成本高性价比需自行预估资源,规划架构性能大量集群优化经验,根据业务需求进行点对点优化采用开源社区版本,性...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。