Kettle實現數據庫遷移

時間 2019-11-08

標籤 kettle 實現數據庫遷移欄目 SQL 简体版

原文原文鏈接

需求：

作數據倉庫時,須要將業務系統CRM抽取到數據倉庫的緩衝層，業務系統使用的是SqlServer數據庫，數據倉庫的緩衝層使用的是mysql數據庫，爲實現數據庫的遷移，即將SqlServer數據庫中的全部表與數據遷移到Mysql。 java

解決辦法: kettle設計一整套流程實現，讀取數據庫中表->建立表->表數據抽取

實現過程：

整套流程分爲：2個job，4個trans。使用到的Trans插件：表輸入、字段選擇、複製記錄到結果、從結果獲取記錄、設置變量、java腳本、表輸出。mysql

一、表數據抽取做業:sql

做用:首先獲取數據庫中全部的表名稱而後調用子Job進行表的建立、數據抽取數據庫

2.表名稱獲取流程 ide

要遷移的源庫表名稱獲取，並設置到結果集，爲下面的job使用。其中的表輸入使用的是show tables，複製數據庫中全部的表，也能夠從表中或者excel中輸入，實現更加小粒度的控制。

show tables 結果爲Tables_in_數據庫名稱,和具體數據庫有關，故須要更名
函數

三、子做業: 實現單個表格的建立及抽取spa

四、表名稱變量設置插件

上一步的子轉換設計

五、入庫表結構建立 excel

執行的Java代碼以下

public boolean processRow(StepMetaInterface smi, StepDataInterface sdi) throws KettleException
{
    // First, get a row from the default input hop

	Object[] r = getRow();

	org.pentaho.di.core.database.DatabaseMeta dbmeta = null;
	System.out.println(123);
    System.out.println( getTrans().getRepository());
    System.out.println(456);
	java.util.List list = getTrans().getRepository().readDatabases();
	
	if(list != null && !list.isEmpty())
	{
		for(int i=0;i<list.size();i++)
		{
			dbmeta = (org.pentaho.di.core.database.DatabaseMeta)list.get(i);
    //test1 爲數據庫名稱
			if("test1".equalsIgnoreCase(dbmeta.getName()))
			{				
				break;
			}
		}
	}

	if(dbmeta!=null)
	{
		org.pentaho.di.core.database.Database db=new org.pentaho.di.core.database.Database(dbmeta);
		
		try
		{
			db.connect();

			String tablename = getVariable("TABLENAME");

			logBasic("開始建立表：" + tablename);
			
			if(tablename!=null && tablename.trim().length()>0)
			{
				String sql = db.getDDLCreationTable(tablename, data.inputRowMeta);//${TABLENAME}
							
				db.execStatement(sql.replace(";", ""));

				logBasic(sql);
			}
		}
		catch(Exception e)
		{			
			logError("建立表出現異常",e);
			
		}finally{
			db.disconnect();
		}
	}
	return false;
}

六、表數據抽取流程