1、等價和覆蓋
定義:關係模式R<u,f>上的兩個依賴集F和G,若是F+=G+,則稱F和G是等價的,記作F≡G。若F≡G,則稱G是F的一個覆蓋,反之亦然。兩個等價的函數依賴集在表達能力上是徹底相同的。
2、最小函數依賴集
定義:若是函數依賴集F知足下列條件,則稱F爲最小函數依賴集或最小覆蓋。
① F中的任何一個函數依賴的右部僅含有一個屬性;
② F中不存在這樣一個函數依賴X→A,使得F與F-{X→A}等價;
③ F中不存在這樣一個函數依賴X→A,X有真子集Z使得F-{X→A}∪{Z→A}與F等價。
算法:計算最小函數依賴集。
輸入 一個函數依賴集
輸出 F的一個等價的最小函數依賴集G
步驟:① 用分解的法則,使F中的任何一個函數依賴的右部僅含有一個屬性;
② 去掉多餘的函數依賴:從第一個函數依賴X→Y開始將其從F中去掉,而後在剩下的函數依賴中求X的閉包X+,看X+是否包含Y,如果,則去掉X→Y;不然不能去掉,依次作下去。直到找不到冗餘的函數依賴;
③去掉各依賴左部多餘的屬性。一個一個地檢查函數依賴左部非單個屬性的依賴。例如XY→A,若要判Y爲多餘的,則以X→A代替XY→A是否等價?若A
(X)+,則Y是多餘屬性,能夠去掉。
舉例:已知關係模式R<u,f>,U={A,B,C,D,E,G},F={AB→C,D→EG,C→A,BE→C,BC→D,CG→BD,ACD→B,CE→AG},求F的最小函數依賴集。
解1:利用算法求解,使得其知足三個條件
① 利用分解規則,將全部的函數依賴變成右邊都是單個屬性的函數依賴,得F爲:F={AB→C,D→E,D→G,C→A,BE→C,BC→D,CG→B,CG→D,ACD→B,CE→A,CE→G}
② 去掉F中多餘的函數依賴
A.設AB→C爲冗餘的函數依賴,則去掉AB→C,得:F1={D→E,D→G,C→A,BE→C,BC→D,CG→B,CG→D,ACD→B,CE→A,CE→G}
計算(AB)F1+:設X(0)=AB
計算X(1):掃描F1中各個函數依賴,找到左部爲AB或AB子集的函數依賴,由於找不到這樣的函數依賴。故有X(1)=X(0)=AB,算法終止。
(AB)F1+= AB不包含C,故AB→C不是冗餘的函數依賴,不能從F1中去掉。
B.設CG→B爲冗餘的函數依賴,則去掉CG→B,得:F2={AB→C,D→E,D→G,C→A,BE→C,BC→D,CG→D,ACD→B,CE→A,CE→G}
計算(CG)F2+:設X(0)=CG
計算X(1):掃描F2中的各個函數依賴,找到左部爲CG或CG子集的函數依賴,獲得一個C→A函數依賴。故有X(1)=X(0)∪A=CGA=ACG。
計算X(2):掃描F2中的各個函數依賴,找到左部爲ACG或ACG子集的函數依賴,獲得一個CG→D函數依賴。故有X(2)=X(1)∪D=ACDG。
計算X(3):掃描F2中的各個函數依賴,找到左部爲ACDG或ACDG子集的函數依賴,獲得兩個ACD→B和D→E函數依賴。故有X(3)=X(2)∪BE=ABCDEG,由於X(3)=U,算法終止。
(CG)F2+=ABCDEG包含B,故CG→B是冗餘的函數依賴,從F2中去掉。
C.設CG→D爲冗餘的函數依賴,則去掉CG→D,得:F3={AB→C,D→E,D→G,C→A,BE→C,BC→D,ACD→B,CE→A,CE→G}
計算(CG)F3+:設X(0)=CG
計算X(1):掃描F3中的各個函數依賴,找到左部爲CG或CG子集的函數依賴,獲得一個C→A函數依賴。故有X(1)=X(0)∪A=CGA=ACG。
計算X(2):掃描F3中的各個函數依賴,找到左部爲ACG或ACG子集的函數依賴,由於找不到這樣的函數依賴。故有X(2)=X(1),算法終止。(CG)F3+=ACG。
(CG)F3+=ACG不包含D,故CG→D不是冗餘的函數依賴,不能從F3中去掉。
D.設CE→A爲冗餘的函數依賴,則去掉CE→A,得:F4={AB→C,D→E,D→G,C→A,BE→C,BC→D,CG→D,ACD→B,CE→G}
計算(CG)F4+:設X(0)=CE
計算X(1):掃描F4中的各個函數依賴,找到左部爲CE或CE子集的函數依賴,獲得一個C→A函數依賴。故有X(1)=X(0)∪A=CEA=ACE。
計算X(2):掃描F4中的各個函數依賴,找到左部爲ACE或ACE子集的函數依賴,獲得一個CE→G函數依賴。故有X(2)=X(1)∪G=ACEG。
計算X(3):掃描F4中的各個函數依賴,找到左部爲ACEG或ACEG子集的函數依賴,獲得一個CG→D函數依賴。故有X(3)=X(2)∪D=ACDEG。
計算X(4):掃描F4中的各個函數依賴,找到左部爲ACDEG或ACDEG子集的函數依賴,獲得一個ACD→B函數依賴。故有X(4)=X(3)∪B=ABCDEG。由於X(4)=U,算法終止。
(CE)F4+=ABCDEG包含A,故CE→A是冗餘的函數依賴,從F4中去掉。
③ 去掉F4中各函數依賴左邊多餘的屬性(只檢查左部不是單個屬性的函數依賴)因爲C→A,函數依賴ACD→B中的屬性A是多餘的,去掉A得CD→B。
故最小函數依賴集爲:F={AB→C,D→E,D→G,C→A,BE→C,BC→D,CG→D,CD→B,CE→G}
解2:利用Armstrong公理系統的推理規則求解
① 假設CG→B爲冗餘的函數依賴,那麼,從F中去掉它後能根據Armstrong公理系統的推理規則導出。
由於CG→D (已知)
因此CGA→AD,CGA→ACD (增廣律)
由於ACD→B (已知)
因此CGA→B (傳遞律)
由於C→A (已知)
因此CG→B (僞傳遞律)
故CG→B是冗餘的。
② 同理可證:CE→A是多餘的。
③ 又因C→A,可知函數依賴ACD→B中的屬性A是多餘的,去掉A得CD→B。html
故最小函數依賴集爲:F={AB→C,D→E,D→G,C→A,BE→C,BC→D,CG→D,CD→B,CE→G}ios
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
|
//數據庫編程實驗
//求最小覆蓋Fm
//輸入:屬性全集U,U上的函數依賴集F
//輸出:函數依賴集F的最小覆蓋Fm
#include <iostream>
#include <string>
using namespace std;
struct FunctionDependence//函數依賴
{
string X;//決定因素
string Y;
};
void Init (FunctionDependence FD[],
int
n)
{
//函數依賴關係初始化
int
i;
string x,y;
cout<<
"請輸入F中的函數依賴(決定因素在左,被決定因素在右)"
<<endl; cin=
""
f=
""
for
=
""
i=
"0;i<n;i++)"
>>x>>y;
FD[i].X=x;
FD[i].Y=y;
}
cout<<
"函數依賴集合"
;
cout<<
"F={"
;
for
(i=0;i<n;i++) -=
""
bool=
""
count
=
"=length1)"
f=
""
flag=
"false;"
for
=
""
i=
"0;i<length1;i++)"
if=
""
ii=
"0;ii<200;ii++)"
int
=
""
kk=
"0;kk<size;kk++)"
length1=
"=length2)"
length2=
"b.length();"
return
=
""
size
=
"mm.length();"
ss=
"\0"
string=
""
>=1)
ss+=(
char
)ii;
}
return
ss;
}
bool IsIn(string f,string zz)//可以判斷F中決定因素f裏全部的因素是否在X中,但這樣可能致使結果出現重複
{
bool flag1=
false
;
int
len1=f.length();
int
len2=zz.length();
int
k=0,t=0,count1=0;
for
(k=0;k<len1;k++) count1=
"=len1)"
else
=
""
flag1=
"true;break;"
for
=
""
functiondependence=
""
i=
"0;i<n;i++)"
if=
""
int
=
""
left
-=
""
return
=
""
string=
""
t=
"0;t<len2;t++)"
>
right
void Cut(FunctionDependence FD[],
int
n,string
left
,string
right
,FunctionDependence Dyna[])
{
int
i=0,j=0,
count
=0;
for
(i=0;i<n;i++) -=
""
.x=
"FD[i].X;"
.y=
"FD[i].Y;"
else
=
""
f=
"{""
j=
"0;j<count;j++)"
>
"<<dyna[j].y; -="
" .x="
Dyna1[k].X;
" .y="
Dyna1[k].Y;
" a.y="
=b.Y))"
" bool="
" else="
" f="
{";
" for="
" functiondependence="
" i="
0;i<count1;i++)
" if="
" int="
" j="
0;j<
count
;j++)
" k="
0;k<
count
;k++)
" return="
" void="
" y="
">"
<<dyna3[i].y; -=
""
.x=
"FD[i].X;"
.y=
"(FD[i].Y)[j];"
count
=
"0;"
d=
"n;"
f=
"{""
fm=
"<<"
for
=
""
functiondependence=
""
i=
"0;i<n;i++)"
if=
""
int
=
""
j=
"0;j<lengthR;j++)//將右部分解成單一屬性,添加到屬性集合的後面"
k=
"0;k<count;k++)"
lengthr=
"0,i=0,j=0,k=0;"
static
=
""
void=
""
>
"<<dynamicfd[k].y; cin="
" d="
count
;
" functiondependence="
" if="
" int="
" void="
">>N;
FunctionDependence fd[N];
Fmin(fd,N);
// SingleR(fd,N);
// CutSameFD(fd,N);
// FD(fd,N);
return
0;
} </dynamicfd[k].y;></dyna3[i].y;></dyna[j].y;></n;i++)></len1;k++)></n;i++)></endl;></string></iostream>
|
很後悔沒有用鏈式結構,致使增長刪除節點很麻煩,權看成爲概念理解的幫助吧。算法