二叉查找樹是將一組無序的數據構建成一顆有序數據的樹,其設計思想與二分法相似。很好的提升了海量數據查找效率,使得由從頭遍歷到尾的方式轉爲二分查找的方式,時間複雜度從O(n)下降爲O(log(n))。java
構建二叉查找樹,主要把握幾條原則,小於當前結點的在左邊,大於的在右邊,相等的不予處理。可是狀況下結合實際業務需求,也可在相等時放在左結點或右結點,可是必須統一規則,不能左右都存在相等的。 建立結點對象:node
package com.ytao.bst;
/** * Created by YANGTAO on 2019/11/3 0003. */
public class Node {
private Integer value;
private Node leftChildren;
private Node rightChildren;
public Integer getValue() {
return value;
}
public void setValue(Integer value) {
this.value = value;
}
public Node getLeftChildren() {
return leftChildren;
}
public void setLeftChildren(Node leftChildren) {
this.leftChildren = leftChildren;
}
public Node getRightChildren() {
return rightChildren;
}
public void setRightChildren(Node rightChildren) {
this.rightChildren = rightChildren;
}
public Node(Integer value) {
this.value = value;
}
}
複製代碼
建立樹的實現:bash
package com.ytao.bst;
/** * Created by YANGTAO on 2019/11/3 0003. */
public class BuildBST {
private Node rootNode = null;
public Node build(int[] vals){
// 遍歷全部數據,每次都需從根結點開始尋找左或右子節點爲空的位置添加
for (int val : vals) {
this.assemble(rootNode, val);
}
return rootNode;
}
private void assemble(Node node, int val){
// 建立根結點
if (node == null){
rootNode = new Node(val);
}else{
// 根據左小右大特性判斷
if (val < node.getValue()){
Node leftNode = node.getLeftChildren();
// 若是左子結點爲空,就添加爲當前結點的左結點,不然繼續遞歸下去
if (leftNode == null){
node.setLeftChildren(new Node(val));
}else{
this.assemble(node.getLeftChildren(), val);
}
}else{
Node rightNode = node.getRightChildren();
// 若是右子結點爲空,就添加爲當前結點的右結點,不然繼續遞歸下去
if (rightNode == null){
node.setRightChildren(new Node(val));
}else{
this.assemble(rightNode, val);
}
}
}
}
}
複製代碼
使用[7,5,9,2,11,6]
測試是否知足咱們建立樹的要求:測試
public static void main(String[] args) {
int[] vals = {7,5,9,2,11,6};
Node node = new BuildBST().build(vals);
System.out.println(new Gson().toJson(node));
}
複製代碼
測試結果知足咱們要求優化
{
"value": 7,
"leftChildren": {
"value": 5,
"leftChildren": {
"value": 2
},
"rightChildren": {
"value": 6
}
},
"rightChildren": {
"value": 9,
"rightChildren": {
"value": 11
}
}
}
複製代碼
假設從一百萬個數字中獲取值爲88的數據,若是咱們使用遍歷的方式,最糟的狀況就是排在第一百萬個位置的時候,須要咱們遍歷一百萬次才能獲取到數據,這就是咱們最不想遇到的狀況。這時將一百萬個數據構建成二叉查找樹,咱們就可經過樹快速找到咱們想要的數據。 因爲設定一百萬個數據比較多,這裏咱們舉例當前擁有數據[7,5,9,2,11,6]
,咱們要找出其中的6
。 使用循環遍歷全部數據的方法,咱們須要6次遍歷 7->5->9->2->11->6。 使用二叉查找樹查找時,首先構建好的二叉查找樹的結構如圖:ui
從根結點開始查找;this
獲取根結點7,不等於6,且6<7,因此繼續找左子結點;spa
獲取到結點5,不等於6,且6>5,因此繼續找右子節點;設計
最終獲取到結點6,知足咱們須要的條件。所遍歷的數據爲 7->5->6。 代碼實現查找:code
package com.ytao.bst;
/** * Created by YANGTAO on 2019/11/3 0003. */
public class SearchBST {
public Node search(Node node, int val){
// 若是結點爲空,說明是沒有了符合的結點
if (node == null)
return null;
int nodeVal = node.getValue();
// 若是結點上的鍵值相等,就是咱們須要找的結點
if (val == nodeVal){
return node;
}else if (val < nodeVal){ // 若是小於結點的值,那麼必定在結點的左子樹中
return this.search(node.getLeftChildren(), val);
}else{
return this.search(node.getRightChildren(), val);
}
}
}
複製代碼
二叉查找樹的插入規則,必須是要插入後的結點是做爲葉子結點。如今向上面的樹中插入10,根據上面所分析到的規則,爲確保二叉查找樹的完整性,最終的插入流程爲7->9->11->10:
代碼實現:
package com.ytao.bst;
/** * Created by YANGTAO on 2019/11/3 0003. */
public class InsertBST {
public void inesrt(Node node, int newVal){
// 當結點爲空是,說明是做爲根結點
if (node == null){
node = new Node(newVal);
}
int nodeVal = node.getValue();
// 若是小於結點的值,插入到左子樹中,大於就插入右子樹中
if (newVal < nodeVal){
Node leftNode = node.getLeftChildren();
// 爲空時,說明爲葉子結點,可插入
if (leftNode == null){
node.setLeftChildren(new Node(newVal));
}else {
this.inesrt(leftNode, newVal);
}
}else if (newVal > nodeVal){
Node rightNode = node.getRightChildren();
if (rightNode == null){
node.setRightChildren(new Node(newVal));
}else {
this.inesrt(rightNode, newVal);
}
}else {
// todo 相等時,可根據具體業務處理,放棄,或在左右樹中選擇一個
}
}
}
複製代碼
刪除結點分爲多種狀況,其中主要分析的:
刪除葉子結點,將所要刪除的葉子結點直接刪除即可,好比刪除結點6。
被刪除結點,若是隻有一個子結點,那麼被刪除結點刪除後,該結點的子結點補上其位置,好比刪除結點9。
爲了更加清楚表達刪除存在左右結點的結點,先向樹中多添加3個結點8,10,15。而後刪除結點9。 這裏的解決方法就是,刪除9後,能夠用前驅結點或後繼結點補上。前驅結點爲左子樹中最大的結點,後繼結點爲右子樹中最小的結點。 如今之後繼結點補上的方案爲:
後繼結點補上刪除後的結點:
完成刪除,後繼結點補充上後:
代碼實現:
package com.ytao.bst;
/** * Created by YANGTAO on 2019/11/3 0003. */
public class DeleteBST {
public Node delete(Node node, int delVal) {
// 爲空時,表明葉子結點
if (node == null){
return node;
}
int nodeVal = node.getValue();
Node leftNode = node.getLeftChildren();
Node rightNode = node.getRightChildren();
// 刪除的結點,與遍歷到的當前結點作比較,小於,大於或等於
if (delVal < nodeVal){
Node tempLeftNode = delete(leftNode, delVal);
node.setLeftChildren(tempLeftNode);
} else if(delVal > nodeVal){
Node tempRightNode = delete(rightNode, delVal);
node.setRightChildren(tempRightNode);
} else {
// 刪除的結點與當前遍歷到的結點相等時
// 而且左結點爲空時,返回右結點去補上刪除的位置,反則返回左結點補上
// 說明刪除結點爲單子結點的狀況
if (leftNode == null){
return rightNode;
} else if (rightNode == null){
return leftNode;
}
// 經過查詢最小右結點,獲取後繼結點
Node minNode = minNode(rightNode);
int minNodeValue = minNode.getValue();
node.setValue(minNodeValue);
// 刪除後繼結點
Node tempRightNode = delete(rightNode, minNodeValue);
node.setRightChildren(tempRightNode);
}
return node;
}
private Node minNode(Node node) {
// 一直尋找最小值,知道左子節點爲空爲止
Node leftNode = node.getLeftChildren();
if (leftNode != null)
return minNode(leftNode);
return node;
}
}
複製代碼
至此上面三中狀況都予知足。
上面對二叉查找樹的操做都已介紹,可是正真使用中,是要結合實際業務進行相關調整來知足本身的需求,否則,一切的優化手段都是假把式。二叉查找樹雖然好用,可是它也是有必定要求,在數據量不大的狀況下,使用遍歷的方式,更加符合咱們的要求,因此它使用場景通常是在海量數據的查詢,用來提查詢效率。
我的博客: ytao.top
個人公衆號 ytao