JavaShuo
欄目
標籤
給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
時間 2021-01-20
標籤
java面試
欄目
HTTP/TCP
简体版
原文
原文鏈接
採用分治的思想 假如每個url大小爲64bytes,那麼可以估計每個文件的大小爲50G×64=320G,遠遠大於內存限制的4G,所以不可能將其完全加載到內存中處理,可以採用分治的思想來解決。 Step1:遍歷文件a,對每個url求取hash(url)%1000,然後根據所取得的值將url分別存儲到1000個小文件(記爲a0,a1,...,a999,每個小文件約300M); Step2:
>>阅读原文<<
相關文章
1.
給定a、b兩個文件,各存放50億個url,每個url各佔64字節
2.
面試- 阿里-. 大數據題目- 給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
3.
給定a、b兩個文件,各存放50億個url,每一個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
4.
給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
5.
海量數據面試題整理1.給定a、b兩個文件,各存放50億個url,每一個url各佔64字節,內存限制是
6.
有10 億個 url,每一個 url 大小小於 56B,要求去重,內存只給你4G
7.
海量數據實戰(0)從兩個文件50億數據中找出相同的URL
8.
jsp url文件判斷是否存在
9.
php-獲取URL的各個段的值
10.
一個英文字母,一箇中文各佔多少字節?
更多相關文章...
•
PHP 表單 - 驗證郵件和URL
-
PHP教程
•
Thymeleaf標準URL語法
-
Thymeleaf 教程
•
三篇文章瞭解 TiDB 技術內幕——說存儲
•
Docker容器實戰(七) - 容器眼光下的文件系統
相關標籤/搜索
「url」
url
各個
a+b
a&b
b'+'a
a+++++b
02.url
url&http
2.url
Java
快樂工作
HTTP/TCP
SQLite教程
Redis教程
PHP教程
文件系統
存儲
插件
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
部署Hadoop(3.3.0)僞分佈式集羣
2.
從0開始搭建hadoop僞分佈式集羣(三:Zookeeper)
3.
centos7 vmware 搭建集羣
4.
jsp的page指令
5.
Sql Server 2008R2 安裝教程
6.
python:模塊導入import問題總結
7.
Java控制修飾符,子類與父類,組合重載覆蓋等問題
8.
(實測)Discuz修改論壇最後發表的帖子的鏈接爲靜態地址
9.
java參數傳遞時,究竟傳遞的是什麼
10.
Linux---文件查看(4)
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
給定a、b兩個文件,各存放50億個url,每個url各佔64字節
2.
面試- 阿里-. 大數據題目- 給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
3.
給定a、b兩個文件,各存放50億個url,每一個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
4.
給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url?
5.
海量數據面試題整理1.給定a、b兩個文件,各存放50億個url,每一個url各佔64字節,內存限制是
6.
有10 億個 url,每一個 url 大小小於 56B,要求去重,內存只給你4G
7.
海量數據實戰(0)從兩個文件50億數據中找出相同的URL
8.
jsp url文件判斷是否存在
9.
php-獲取URL的各個段的值
10.
一個英文字母,一箇中文各佔多少字節?
>>更多相關文章<<