d3js scales深刻理解

比例尺函數是這樣的javascript函數:javascript

  • 接收一般是數字,日期,類別等data輸入而且:
  • 返回一個表明可視化元素的值,好比座標,顏色,長度或者半徑等

比例尺一般用於變換(或者說映射)抽象的數據值到可視量化變量(好比位置,長度,顏色等)java

好比,假設咱們有如下數組數據:node

[ 0, 2, 3, 5, 7.5, 9, 10 ]

咱們能夠這樣建立一個比例尺函數:git

var myScale = d3.scaleLinear()
  .domain([0, 10])
  .range([0, 600]);

d3將建立一個myScale函數用於接收[0,10]之間的數據輸入(domain)映射爲[0,600]像素的位置數據(range)github

咱們可使用myScale函數來計算對應數據的positions數據:算法

myScale(0);   // returns 0
myScale(2);   // returns 120
myScale(3);   // returns 180
...
myScale(10);  // returns 

如上面所說,比例尺主要用於將抽象數據映射爲可視的量化元素,好比位置,長度,半徑,顏色等。好比,他們能夠這樣應用數組

  • 將抽象數據映射爲0到500的長度值以便在bar chart中使用
  • 將抽象數據映射爲0到200之間的位置數據值以便做爲line charts中點的座標來使用
  • 將百分比變化數據(+4%,+10%,-5%等)映射爲顏色的對應變化(好比使用紅色表示爲正值,正的越多越紅,負值爲綠色,負的越多綠色飽和度越高)
  • 將日期數據映射爲x軸上的位置

Constructing scales

這部分咱們集中使用線性比例尺linear scale做爲例子探討scale的相關知識,在後面再探討其餘類型的比例尺app

var myScale = d3.scaleLinear();

 

注意:v4和v3的聲明方式是不一樣的 d3.scaleLinear() in v4 and d3.scale.linear() in 
myScale
  .domain([0, 100])
  .range([0, 800]);

經過上面的代碼,myScale就成爲有特定意義的比例尺函數了。如今myScale能夠接收任何在0,100之間的domain,而映射到0到800的range裏面。咱們能夠像下面同樣來調用這個比例尺函數:dom

myScale(0);    // returns 0
myScale(50);   // returns 400
myScale(100);  // returns 800

D3 scale types

D3大約有12種不一樣的比例尺類型(scaleLinear, scalePow, scaleQuantise, scaleOrdinal etc.) ,而整體來講咱們能夠分爲3類ide

下面咱們一個一個地來仔細學習一下

Scales with continuous input and continuous output(連續性輸入連續性輸出)

scaleLinear

線性比例尺多是應用最爲普遍的比例尺類型了,由於他們最適合將數據轉化爲位置和長度。所以每每也以線性比例尺爲例去講解和學習比例次的知識

他們使用一個線性函數(y=m*x+b)來表達(domain)和(range)之間的數學函數關係

var linearScale = d3.scaleLinear()
  .domain([0, 10])
  .range([0, 600]);

linearScale(0);   // returns 0
linearScale(5);   // returns 300
linearScale(10);  // returns 600

典型地,他們被用於將抽象數據轉換爲位置,長度等可視元素。所以當咱們創bar chart,line chart,或者其餘不少圖標類型時,咱們可使用它。

除了位置長度做爲range,也可使用顏色值哦(實際上顏色也能夠做爲連續性數據的):

var linearScale = d3.scaleLinear()
  .domain([0, 10])
  .range(['yellow', 'red']);

linearScale(0);   // returns "rgb(255, 255, 0)"
linearScale(5);   // returns "rgb(255, 128, 0)"
linearScale(10);  // returns "rgb(255, 0, 0)"

這個特性經常被用於等值線圖(choropleth),固然咱們也可使用scaleQuantize,scaleQuantile和scaleThrshold.

scalePow

scalePow這個比例次使用y = m * x^k + b這個數學函數來表達domain和range之間的數學函數關係。指數k使用.exponent()來設定:

var powerScale = d3.scalePow() .exponent(0.5) .domain([0, 100]) .range([0, 30]); 
powerScale(0); // returns 0 
powerScale(50); // returns 21.21... 
powerScale(100); // returns 30

scaleSqrt

scaleSqrt 比例次是一種scalePow的特殊形式(k=0.5)一般用於經過面積來表徵圓(而不用半徑)(當使用圓的大小來表達數據值的大小時,一般最佳實踐是使用和數據等比例的面積而非半徑來表達)

var sqrtScale = d3.scaleSqrt()
  .domain([0, 100])
  .range([0, 30]);

sqrtScale(0);   // returns 0
sqrtScale(50);  // returns 21.21...
sqrtScale(100); // returns 30

咱們能夠看到這個例子和上面的例子輸出是同樣的。

scaleLog

Log scales 使用數學對數函數(y = m * log(x) + b)來映射domain和range.若是數據之間有指數關係的話,這個log比例尺最適合

var logScale = d3.scaleLog()
  .domain([10, 100000])
  .range([0, 600]);

logScale(10);     // returns 0
logScale(100);    // returns 150
logScale(1000);   // returns 300
logScale(100000); // returns 600

scaleTime

scaleTime和scaleLinear是相似的,惟一的區別是domain用於表明date的數組。(一般對於時間序列很是有用)

timeScale = d3.scaleTime() .domain([new Date(2016, 0, 1), new Date(2017, 0, 1)]) .range([0, 700]); 
timeScale(new Date(2016, 0, 1)); // returns 0 
timeScale(new Date(2016, 6, 1)); // returns 348.00... 
timeScale(new Date(2017, 0, 1)); // returns 700

scaleSequential

scaleSequential用於將連續性的數據映射爲由預約義或者定製的插值函數決定的range.(一個插值函數是一個接受0到1之間的數值而輸出一個在兩個數字,兩個顏色值或者兩個字符串之間的插值的函數)

D3提供了不少預約義的插值函數,其中包含着不少顏色相關的插值函數。例如,咱們可使用d3.interpolateRainbow來建立著名的彩虹色系圖:

var sequentialScale = d3.scaleSequential()
  .domain([0, 100])
  .interpolator(d3.interpolateRainbow);

sequentialScale(0);   // returns 'rgb(110, 64, 170)'
sequentialScale(50);  // returns 'rgb(175, 240, 91)'
sequentialScale(100); // returns 'rgb(110, 64, 170)'

須要注意的是插值函數決定了output range,所以你不須要對這個sequential scale來指定range

下面的列子展現由d3提供的其餘顏色插值範圍函數:

var linearScale = d3.scaleLinear()
    .domain([0, 100])
    .range([0, 600]);

var sequentialScale = d3.scaleSequential()
    .domain([0, 100]);

var interpolators = [
    'interpolateViridis',
    'interpolateInferno',
    'interpolateMagma',
    'interpolatePlasma',
    'interpolateWarm',
    'interpolateCool',
    'interpolateRainbow',
    'interpolateCubehelixDefault'
];

var myData = d3.range(0, 100, 2);

function dots(d) {
    sequentialScale
        .interpolator(d3[d]);

    d3.select(this)
        .append('text')
        .attr('y', -10)
        .text(d);

    d3.select(this)
        .selectAll('rect')
        .data(myData)
        .enter()
        .append('rect')
        .attr('x', function(d) {
            return linearScale(d);
        })
        .attr('width', 11)
        .attr('height', 30)
        .style('fill', function(d) {
            return sequentialScale(d);
        });
}

d3.select('#wrapper')
    .selectAll('g.interpolator')
    .data(interpolators)
    .enter()
    .append('g')
    .classed('interpolator', true)
    .attr('transform', function(d, i) {
        return 'translate(0, ' + (i * 70) + ')';
    })
    .each(dots);

 

除了d3定義的這些顏色插值範圍函數,也有一個 d3-scale-chromatic plugin, 提供著名的 ColorBrewer colour schemes.

Clamping

默認狀況下 scaleLinear, scalePow, scaleSqrt, scaleLog, scaleTime and scaleSequential 容許輸入值在domain範圍以外好比:

var linearScale = d3.scaleLinear()

  .domain([0, 10])
  .range([0, 100]);

linearScale(20);  // returns 200
linearScale(-10); // returns -100

在這種狀況下scale函數就使用外推算法來返回domain範圍以外的輸入值對應的返回值。

若是咱們但願比例尺函數嚴格限制輸入值必須在domain規定的範圍內,咱們則可使用.clamp()調用

linearScale.clamp(true);

linearScale(20);  // returns 100
linearScale(-10); // returns 0

咱們也能夠隨時經過clamp(false)來關閉這個功能

Nice

若是domain是由實際數據自動算出來的,好比使用d3.extent,d3.min/max來定義,那麼起始和結束數據可能並非整數。這自己並非什麼問題,可是若是使用這個比例尺函數來定義一個座標軸,則顯得很不整潔

var data = [0.243, 0.584, 0.987, 0.153, 0.433];
var extent = d3.extent(data);

var linearScale = d3.scaleLinear()
  .domain(extent)
  .range([0, 100]);

咱們經過使用.nice()函數,那麼就將domain作了nice處理:

linearScale.nice();

須要注意的是.nice()函數必須在domain更新後每次都必須從新調用!

Multiple segments

The domain and range of scaleLinear, scalePow, scaleSqrt, scaleLog and scaleTime usually consists of two values, but if we provide 3 or more values the scale function is subdivided into multiple segments:

一般scaleLinear,scalePow,scaleSqrt,scaleLog和scaleTime比例尺的domain和range都只包含兩個數值:起始和結束值來定義,可是若是咱們提供3個甚至更多的值,那麼比例尺函數就將被劃分爲幾個段segments:

var linearScale = d3.scaleLinear()
  .domain([-10, 0, 10])
  .range(['red', '#ddd', 'blue']);

linearScale(-10);  // returns "rgb(255, 0, 0)"
linearScale(0);    // returns "rgb(221, 221, 221)"
linearScale(5);    // returns "rgb(128, 128, 255)"

看看一個例子效果:

var xScale = d3.scaleLinear()
    .domain([-10, 10])
    .range([0, 600]);

var linearScale = d3.scaleLinear()
    .domain([-10, 0, 10])
    .range(['red', '#ddd', 'blue']);

var myData = [-10, -8, -6, -4, -2, 0, 2, 4, 6, 8, 10];

d3.select('#wrapper')
    .selectAll('circle')
    .data(myData)
    .enter()
    .append('circle')
    .attr('r', 10)
    .attr('cx', function(d) {
        return xScale(d);
    })
    .style('fill', function(d) {
        return linearScale(d);
    });

典型地,多segment的比例尺一般用於區分正負值(正如上面例子所示)。只要domain和range的段數是相同的,咱們可使用任意多segments的比例尺.

Inversion

 .invert() 方法接受一個range輸出來反算對應的input domain

var linearScale = d3.scaleLinear()
  .domain([0, 10])
  .range([0, 100]);

linearScale.invert(50);   // returns 5
linearScale.invert(100);  // returns 10

A common use case is when we want to convert a user’s click along an axis into a domain value:

這個方法的典型使用場景是咱們將用戶沿着某座標軸點擊座標反轉爲domain值:

var width = 600;

var linearScale = d3.scaleLinear()
  .domain([-50, 50])
  .range([0, width])
  .nice();

var clickArea = d3.select('.click-area').node();

function doClick() {
    var pos = d3.mouse(clickArea);
    var xPos = pos[0];
    var value = linearScale.invert(xPos);
    d3.select('.info')
        .text('You clicked ' + value.toFixed(2));
}

// Construct axis
var axis = d3.axisBottom(linearScale);
d3.select('.axis')
    .call(axis);

// Update click area size
d3.select('.click-area')
    .attr('width', width)
    .attr('height', 40)
    .on('click', doClick);

Scales with continuous input and discrete output

scaleQuantize

scaleQuantize 接受連續性的range輸入而輸出由range定義的離散輸出

var quantizeScale = d3.scaleQuantize()
  .domain([0, 100])
  .range(['lightblue', 'orange', 'lightgreen', 'pink']);

quantizeScale(10);   // returns 'lightblue'
quantizeScale(30);  // returns 'orange'
quantizeScale(90);  // returns 'pink'
Each range value is mapped to an equal sized chunk in the domain so in the example above:
每個range值都被映射爲一個domain的等份量值區間
  • 0 ≤ u < 25 is mapped to ‘lightblue’
  • 25 ≤ u < 50 is mapped to ‘orange’
  • 50 ≤ u < 75 is mapped to ‘lightgreen’
  • 75 ≤ u < 100 is mapped to ‘pink’

u 是輸入domain值

注意因爲咱們使用了.clamp指示,所以quantizeScale(-10)返回'lightblue',而quantizeScale(110)返回'pink'

scaleQuantile

scaleQuantile 將輸入的連續性domain值映射爲離散的值。domain是由數組來定義:

var myData = [0, 5, 7, 10, 20, 30, 35, 40, 60, 62, 65, 70, 80, 90, 100];

var quantileScale = d3.scaleQuantile()
  .domain(myData)
  .range(['lightblue', 'orange', 'lightgreen']);

quantileScale(0);   // returns 'lightblue'
quantileScale(20);  // returns 'lightblue'
quantileScale(30);  // returns 'orange'
quantileScale(65);  // returns 'lightgreen'

var myData = [0, 5, 7, 10, 20, 30, 35, 40, 60, 62, 65, 70, 80, 90, 100];

var linearScale = d3.scaleLinear()
    .domain([0, 100])
    .range([0, 600]);

var quantileScale = d3.scaleQuantile()
    .domain(myData)
    .range(['lightblue', 'orange', 'lightgreen']);

d3.select('#wrapper')
    .selectAll('circle')
    .data(myData)
    .enter()
    .append('circle')
    .attr('r', 3)
    .attr('cx', function(d) {
        return linearScale(d);
    })
    .style('fill', function(d) {
        return quantileScale(d);
    });

排好序的domain數組被均分爲n個子範圍,這裏n是range數值的個數

這樣在上面的例子中domain數組就被均分爲3個groups:

  • the first 5 values are mapped to ‘lightblue’
  • the next 5 values to ‘orange’ and
  • the last 5 values to ‘lightgreen’.

具體的domain均分點能夠經過.quantiles()來訪問

quantileScale.quantiles();  // returns [26.66..., 63]

若是range包含4個值,那麼quantileScale將這樣計算quantiles: 最低25%的數據被映射爲range[0], 下一個25%則映射爲range[1],以此類推。

scaleThreshold

scaleThreshold 映射連續的輸入domain爲由range來定義的離散值. 若是range值有n個,則將會有n-1個切分點

下面的例子咱們在0, 50100處切分

  • u < 0 is mapped to ‘#ccc’
  • 0 ≤ u < 50 to ‘lightblue’
  • 50 ≤ u < 100 to ‘orange’
  • u ≥ 100 to ‘#ccc’

這裏u 是input value.

var thresholdScale = d3.scaleThreshold()
  .domain([0, 50, 100])
  .range(['#ccc', 'lightblue', 'orange', '#ccc']);

thresholdScale(-10);  // returns '#ccc'
thresholdScale(20);   // returns 'lightblue'
thresholdScale(70);   // returns 'orange'
thresholdScale(110);  // returns '#ccc'

詳細代碼以下:

var linearScale = d3.scaleLinear()
    .domain([-10, 110])
    .range([0, 600]);

var thresholdScale = d3.scaleThreshold()
    .domain([0, 50, 100])
    .range(['#ccc', 'lightblue', 'orange', '#ccc']);

var myData = d3.range(-10, 110, 2);

d3.select('#wrapper')
    .selectAll('rect')
    .data(myData)
    .enter()
    .append('rect')
    .attr('x', function(d) {
        return linearScale(d);
    })
    .attr('width', 9)
    .attr('height', 30)
    .style('fill', function(d) {
        return thresholdScale(d);
    });

Scales with discrete input and discrete output

scaleOrdinal

scaleOrdinal 將離散的domain values array映射爲離散的range values array. domain input array指定可能的輸入value,而range array則定義對應的可能的輸出value.若是range array比domain array要短,則range array會重複循環

var myData = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']

var ordinalScale = d3.scaleOrdinal()
  .domain(myData)
  .range(['black', '#ccc', '#ccc']);

ordinalScale('Jan');  // returns 'black';
ordinalScale('Feb');  // returns '#ccc';
ordinalScale('Mar');  // returns '#ccc';
ordinalScale('Apr');  // returns 'black';

完整代碼以下:

var myData = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']

var linearScale = d3.scaleLinear()
    .domain([0, 11])
    .range([0, 600]);

var ordinalScale = d3.scaleOrdinal()
    .domain(myData)
    .range(['black', '#ccc', '#ccc']);

d3.select('#wrapper')
    .selectAll('text')
    .data(myData)
    .enter()
    .append('text')
    .attr('x', function(d, i) {
        return linearScale(i);
    })
    .text(function(d) {
        return d;
    })
    .style('fill', function(d) {
        return ordinalScale(d);
    });

By default if a value that’s not in the domain is used as input, the scale will implicitly add the value to the domain:

默認狀況下若是輸入值不在domain範圍內,scale會隱含地添加這個值到domain中去。

ordinalScale('Monday');  // returns 'black';

若是這不是咱們想要的行爲,咱們可使用.unknown()函數來設定一個unknown values

ordinalScale.unknown('Not a month');
ordinalScale('Tuesday'); // returns 'Not a month'

D3也提供一些預約義好的color scheme

var ordinalScale = d3.scaleOrdinal()
  .domain(myData)
  .range(d3.schemePaired);
var myData = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']

var linearScale = d3.scaleLinear()
  .domain([0, 11])
  .range([0, 600]);

var ordinalScale = d3.scaleOrdinal()
  .domain(myData)
  .range(d3.schemePaired);

d3.select('#wrapper')
  .selectAll('text')
  .data(myData)
  .enter()
  .append('text')
  .attr('x', function(d, i) {
    return linearScale(i);
  })
  .text(function(d) {
    return d;
  })
  .style('fill', function(d) {
    return ordinalScale(d);
  });

(Note that the Brewer colour schemes are defined within a separate file d3-scale-chromatic.js.)

scaleBand

當建立一個bar chart時,scaleBand能夠幫助咱們來決定bar的幾何形狀,而且已經考慮好了各個bar之間的padding值。

輸入的domain經過一個數值數組來指定(每一個值都對應一個band)而且range經過bands的最小和最大範圍來定義(也就是bar chart的整個寬度)

scaleBand會將range劃分爲n個bands(n是domain數組的數值個數)而且在考慮padding的狀況下計算出每一個band的位置和寬度.

var bandScale = d3.scaleBand()
  .domain(['Mon', 'Tue', 'Wed', 'Thu', 'Fri'])
  .range([0, 200]);

bandScale('Mon'); // returns 0
bandScale('Tue'); // returns 40
bandScale('Fri'); // returns 160

每一個band的寬度可使用.bandWidth()來訪問。

bandScale.bandwidth();  // returns 40

有兩種padding能夠被配置:

  • paddingInner which specifies (as a percentage of the band width) the amount of padding between each band
  • paddingOuter which specifies (as a percentage of the band width) the amount of padding before the first band and after the last band

咱們在上面的例子中添加一點inner padding

bandScale.paddingInner(0.05);

bandScale.bandWidth();  // returns 38.38...
bandScale('Mon');       // returns 0
bandScale('Tue');       // returns 40.40...

Putting this all together we can create this bar chart:

上面加起來咱們能夠獲得下面的圖表:

var myData = [
    {day : 'Mon', value: 10},
    {day : 'Tue', value: 40},
    {day : 'Wed', value: 30},
    {day : 'Thu', value: 60},
    {day : 'Fri', value: 30}
];

var bandScale = d3.scaleBand()
    .domain(['Mon', 'Tue', 'Wed', 'Thu', 'Fri'])
    .range([0, 200])
    .paddingInner(0.05);

d3.select('#wrapper')
    .selectAll('rect')
    .data(myData)
    .enter()
    .append('rect')
    .attr('y', function(d) {
        return bandScale(d.day);
    })
    .attr('height', bandScale.bandwidth())
    .attr('width', function(d) {
        return d.value;
    });

 

scalePoint

scalePoint 將離散的輸入數值映射爲在range內等距的點:

var pointScale = d3.scalePoint()
  .domain(['Mon', 'Tue', 'Wed', 'Thu', 'Fri'])
  .range([0, 500]);

pointScale('Mon');  // returns 0
pointScale('Tue');  // returns 125
pointScale('Fri');  // returns 500

完整代碼:

var myData = [
    {day : 'Mon', value: 10},
    {day : 'Tue', value: 40},
    {day : 'Wed', value: 30},
    {day : 'Thu', value: 60},
    {day : 'Fri', value: 30}
];

var pointScale = d3.scalePoint()
    .domain(['Mon', 'Tue', 'Wed', 'Thu', 'Fri'])
    .range([0, 600]);

d3.select('#wrapper')
    .selectAll('circle')
    .data(myData)
    .enter()
    .append('circle')
    .attr('cx', function(d) {
        return pointScale(d.day);
    })
    .attr('r', 4);

 

點之間的距離能夠經過.step()來訪問:

pointScale.step();  // returns 125

outside padding能夠經過和padding to point spacing的比例來指定。好比,若是但願設定outside padding爲point spacing的1/4,那麼能夠這樣設置:

pointScale.padding(0.25);

pointScale('Mon');  // returns 27.77...
pointScale.step();  // returns 111.11...

 

參考閱讀

ColorBrewer schemes for D3

Mike Bostock on d3-scale

相關文章
相關標籤/搜索