JavaShuo
欄目
標籤
給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
時間 2021-01-20
標籤
java面試
欄目
HTTP/TCP
简体版
原文
原文鏈接
採用分治的思想 假如每個url大小爲64bytes,那麼可以估計每個文件的大小爲50G×64=320G,遠遠大於內存限制的4G,所以不可能將其完全加載到內存中處理,可以採用分治的思想來解決。 Step1:遍歷文件a,對每個url求取hash(url)%1000,然後根據所取得的值將url分別存儲到1000個小文件(記爲a0,a1,...,a999,每個小文件約300M); Step2:
>>阅读原文<<
相關文章
1.
給定a、b兩個文件,各存放50億個url,每個url各佔64字節
2.
面試- 阿里-. 大數據題目- 給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
3.
給定a、b兩個文件,各存放50億個url,每一個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
4.
給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
5.
海量數據面試題整理1.給定a、b兩個文件,各存放50億個url,每一個url各佔64字節,內存限制是
6.
有10 億個 url,每一個 url 大小小於 56B,要求去重,內存只給你4G
7.
海量數據實戰(0)從兩個文件50億數據中找出相同的URL
8.
jsp url文件判斷是否存在
9.
php-獲取URL的各個段的值
10.
一個英文字母,一箇中文各佔多少字節?
更多相關文章...
•
PHP 表單 - 驗證郵件和URL
-
PHP教程
•
Thymeleaf標準URL語法
-
Thymeleaf 教程
•
三篇文章瞭解 TiDB 技術內幕——說存儲
•
Docker容器實戰(七) - 容器眼光下的文件系統
相關標籤/搜索
「url」
url
各個
a+b
a&b
b'+'a
a+++++b
02.url
url&http
2.url
Java
快樂工作
HTTP/TCP
SQLite教程
Redis教程
PHP教程
文件系統
存儲
插件
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
JDK JRE JVM,JDK卸載與安裝
2.
Unity NavMeshComponents 學習小結
3.
Unity技術分享連載(64)|Shader Variant Collection|Material.SetPassFast
4.
爲什麼那麼多人用「ji32k7au4a83」作密碼?
5.
關於Vigenere爆0總結
6.
圖論算法之最小生成樹(Krim、Kruskal)
7.
最小生成樹 簡單入門
8.
POJ 3165 Traveling Trio 筆記
9.
你的快遞最遠去到哪裏呢
10.
雲徙探險中臺賽道:借道雲原生,尋找「最優路線」
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
給定a、b兩個文件,各存放50億個url,每個url各佔64字節
2.
面試- 阿里-. 大數據題目- 給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
3.
給定a、b兩個文件,各存放50億個url,每一個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
4.
給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
5.
海量數據面試題整理1.給定a、b兩個文件,各存放50億個url,每一個url各佔64字節,內存限制是
6.
有10 億個 url,每一個 url 大小小於 56B,要求去重,內存只給你4G
7.
海量數據實戰(0)從兩個文件50億數據中找出相同的URL
8.
jsp url文件判斷是否存在
9.
php-獲取URL的各個段的值
10.
一個英文字母,一箇中文各佔多少字節?
>>更多相關文章<<