引子
無雨哪能見晴之可愛,沒有夜也將看不出晝之光明 --郁達夫算法
本次做業數據庫
「NABCDM」分析——更完備的競爭性需求分析
- 或許你會對本次分析的標題感到些許疑惑,但在抱怨以前咱們能夠先來看看下述的兩段話...
- 咱們的產品——吃喝玩樂遍福州計劃以福大周邊各城市廣場爲基點,給廣大現居福州亦或是來福州遊玩的用戶提供一個主要針對餐飲娛樂的第三方評論模式的信息分享平臺。他們須要<Need>——實時、客觀的信息分享平臺以更加輕鬆且有效的方式獲取更多商鋪信息,可是現有的產品並無很好地解決這些需求。咱們有獨特的辦法<Approach>——結合「目標檢測」與「文字識別」而且集成了AR技術爲一體的信息檢索平臺,同時兼具智能情感分析功能——透過各種評論進一步給用戶提供更多信息這樣來知足用戶需求,它能給用戶帶來好處<Benefit>,遠遠超過競爭對手<Competitor>。同時,咱們有高效率的<Delivery>推廣,能很快讓目標用戶知道咱們的產品,並進一步傳播。
- 咱們的產品——吃喝玩樂遍福州計劃以福大周邊各城市廣場爲基點,給廣大現居福州亦或是來福州遊玩的用戶提供一個主要針對餐飲娛樂的第三方評論模式的信息分享平臺。他們須要<Need>——實時、客觀的信息分享平臺以更加輕鬆且有效的方式獲取更多商鋪信息,可是現有的產品並無很好地解決這些需求。咱們有獨特的辦法<Approach>——結合「目標檢測」與「文字識別」而且集成了AR技術爲一體的信息檢索平臺,同時兼具智能情感分析功能——透過各種評論進一步給用戶提供更多信息這樣來知足用戶需求,它能給用戶帶來好處<Benefit>,遠遠超過競爭對手<Competitor>。同時,咱們有高效率的<Delivery>推廣,能很快讓目標用戶知道咱們的產品,並進一步傳播。最後,咱們有完善的<Maintainence>維護與更新機制,系統化的軟件迭代流程,隨着客戶需求的變動以及市場驅動的導向,咱們可以逐步改進和完善咱們的軟件
- 在循序漸進地分析需求時,第二段話是否會更具說服力?
- 需求文檔的確立中不須要考慮軟件的維護問題嗎? 僅僅依靠創新的作法、優秀的推廣能夠說服客戶嗎?
- 不妨來看看下述中咱們團隊對於「NABCDM」的分析吧!
Need——需求
- 基本需求
- 提供針對餐飲娛樂的信息分享功能
- 實現經過AR技術結合天然場景下的文本識別獲取商鋪信息
- 完成商鋪評價的 「情感分析」 ——經過多樣化的評論提供給用戶更多信息
- 附加需求
- 結合GPS完成周邊商鋪的智能推薦
- 數據可視化在商鋪廣場地圖上的實現
Approach——作法
- 基本需求的作法
- 創建數據庫存儲各種信息
- 目標檢測+文字識別+AR接口
- 天然語言處理、情感挖掘
- 附加需求的作法
- GPS接口的導入
- 基於matplotlib+wordcloud完成數據可視化
Benifit——好處
- 用戶可根據自身需求獲取商鋪相關信息,亦可輕鬆經過定位智能推薦商鋪
- 在打字不方便的狀況下,只需輕鬆打開手機一掃便可
- 結合了情感分析以屏蔽「水軍」評論,使用戶能以更客觀的角度獲取更豐富的信息
- 軟件的擴展性易、泛化性強,可結合多種功能
Competitors——競爭
- 競爭中存在着先發優點與後發優點:
- 「先發優點」——先進入市場的產品會使得用戶造成在先發軟件上的習慣,同時須要額外考量遷移成本。
- 「後發優點」——後進入市場的產品能夠在先進入市場的產品上作出改進,更好地知足用戶需求。
- 假想競爭對手
- ① 以其餘一樣參與團隊做業的同窗爲假想競爭對手,因爲咱們的軟件提供了維護的功能——M,我的認爲一個維護有保障的軟件產品在面對客戶需求上徹底不輸於其它看似功能性完備的產品。咱們的軟件產品能夠經過有效、規範的維護更新制度完成良好的產品輸出,而且能持續性給用戶帶來更佳的體驗。
- ② 如果不巧,相較於一樣於一樣也爲客戶提供維護功能的團隊,則進一步轉入各自軟件的功能上的競爭;根據咱們團隊的調研狀況,目前市面上沒有一款以AR技術爲接口結合深度學習分析商鋪的APP,而假設咱們的假想對手作的是諸如市面上常見的諸如推薦、圖像識別等功能,則在創新性方面不如咱們團隊;而如果相較於一樣具備創新型功能的團隊的話,則主要差別度將會體如今上述提到的「先發優點」與「後發優點」上。
更況且咱們有最強的技術團隊。
Delivery——推廣
咱們將推廣思路分爲三個階段——初期、中期、上升期安全
- 推廣的初期,咱們將在學校內宣傳,經過海報、網絡、自印宣傳單等方式,迅速擴大市場範圍。而且根據用戶的反饋信息,對軟件進行進一步的迭代更新。完善功能。接下來推廣到大學城內其餘幾所高校,進行下一步的更新和迭代。
- 進入到中期,積累了必定的用戶量和功能完善,咱們計劃擴大與商家合做,而且借用原先的客戶流量來完成進一步推廣。
- 有了以上的基礎,則進入軟件的上升期,具備較大的用戶量以後,用戶羣體也將產生必定的軟件依賴性,因此咱們計劃在客戶分享的內容的結尾帶上本軟件產品的宣傳標語, 達到擴大影響力的效果。
***
Maintainence——維護
- "NABCD" 是一個兼具泛化性與強健性的模型,在考量需求、推廣的同時,也強調了競爭這一更立足現實的觀點,可以徹底知足市場上絕大部分軟件的需求分析要求。
- 但私覺得在完成 「NABCD」 這樣一個競爭性需求分析框架的同時,咱們團隊更須要一個差別化的焦點來吸引更多的用戶;作出高質量的功能讓用戶口口相傳當然是件極佳的事情,可是咱們終須考慮到軟件的生命週期,作出一個不斷給用戶帶來更佳體驗的軟件。
- 因此應用至本軟件——「吃喝玩樂遍福州」,咱們會持續不斷地提供數據庫更新的支持,也會不斷擴充、完備現有功能,如在提供商鋪評論分析功能的基礎上,提供推薦同類其餘家商鋪的選項,給客戶提供一個不斷「涌入新鮮血液」——不斷更新迭代的平臺。
團隊貢獻度評價準則
- 在每次做業發佈時,線上或線下召開短會安排本次任務,根據每組分配到的任務量定下每組的貢獻度百分比。各組的百分比的總合爲 90% ,剩下 10% 做爲獎勵表現較好的組,若是各組都按時提交計劃任務,則 10% 平均分配給各組。
- 組內的貢獻度由各組的組長進行分配。
- 每一個人最終的貢獻度都會根據提交狀況和完成狀況進行浮動。
- 扣貢獻度的狀況有:
- DDL 以後才提交任務
- 質量差
- 在其餘人的幫助才完成
- ...
- 若有扣貢獻度的狀況,會把扣下的貢獻度分配給按時提交計劃任務的組。
- 任務完成的質量由各小組組長及組長林燊共同認定。
選題報告
點我看看網絡
評審表
點我看看app
答辯總結
本次問答環節,對於較優質問題及質量相對較差的提問均作顏色區分。框架
答第一組
1. 項目功能之一的評論篩選實現難度較高,即便有針對英語比較成熟的機器學習訓練方法,在將語境轉換到中文語境時識別成功率還能保持嗎?畢竟中文語法與英語語法相比有更多不肯定性機器學習
- 答: 首先感謝「爸爸餓了隊」組的提問,答辯後查閱了大量資料發現,
該類中文標註集確實存在較少,針對英文也存在有相似的「facebook」相關的謠言檢測標註集。不過應用於水軍評論上則存在大量問題——如「水軍」界定困難等。原先計劃是經過二分類形式的貝葉斯分類器來完成訓練的,通過組內討論也驗證了此方法過於簡單且數據集存在差別性問題,咱們也所以刪去了該功能。不過這裏我也想簡單提出一個彷佛可行的解決方案:經過網絡上常見的「模板」結合相關「水軍渠道」,以咱們團隊自身角度來標註「水軍」數據集,可是這個工做量實在偏大,所以不作考慮。咱們團隊也歡迎這樣有深度的問題!
- 如何規避爬取如大衆點評的用戶評論時可能存在的法律風險?
- 答: 只要對應網站的robots協議容許或是咱們不用於商業用途就是合法的,因此本產品初期能夠採起不盈利的模式,不斷由用戶提供基於真實體驗後獲得的商鋪信息,待產品成熟後便可不依賴於「爬蟲」,改成應用咱們產品自身數據庫的信息,即可自此開始盈利。
- 在演講階段沒有清楚的闡明用戶的使用場景,但願能得到一個清晰的表述
- 答: 確實咱們在演講階段沒有清楚闡明,僅在答辯階段藉着提問機會才簡單闡明瞭咱們的使用場景——「假定咱們初來福州,想去周邊的城市廣場找家餐館不單爲知足飽腹之飢,更爲有較好的用餐體驗,一家裝潢雅緻的餐館出如今你面前,與此打開手機一步步輸入餐館信息,不如輕輕一掃便可完成信息檢索。"
答第二組
- 關於刪掉水軍這點,感受是挺有難度的,請問打算怎麼實現?
- 答: 首先感謝「拖鞋旅遊隊」的提問,咱們的原先計劃是經過二分類形式的貝葉斯分類器來完成訓練的,通過組內討論也驗證了此方法過於簡單且數據集存在差別性問題,咱們也所以刪去了該功能。不過這裏我也想簡單提出一個彷佛可行的解決方案:經過網絡上常見的「模板」結合相關「水軍渠道」,以咱們團隊自身角度來標註「水軍」數據集,可是這個工做量實在偏大,所以不作考慮。
- 兩個月後開始實現盈利的怎樣得出來的,衆多盈利方式中那點能夠做爲最主要的贏利點,要是兩個月後沒有實現盈利那又該怎麼辦?
- 答: 咱們根據簡單的市場調研得出了上述的結論,咱們的廣告位會做爲咱們的主要盈利點,若兩個月後未實現則會經過咱們提出的三段式維護迭代模塊進一步維護咱們的產品。
- 對於店鋪的安全性和營業資質能夠保證嗎,若是能夠的話,要如何保證?
- 答: 首先店鋪的營業執照均有國家工商局頒發,咱們也會盡力確認。
答第三組
- 對於算法的複雜度實現難度,大家有什麼想改進的嗎
- 答: 首先感謝「彳艮彳亍隊」組的提問,咱們計劃採用遷移學習的形式改進,具體化即爲直推式遷移學習——經過分類器的正負樣本完成遷移訓練。
- 這個項目需求,是否真正知足用戶真實需求?有問卷多少比例的預使用率嗎?
- 答: 咱們主要針對於剛入學的18級新生投放的問卷,約有94%的問卷調查羣體對咱們提供的功能表示承認。
3. 對於相似於美團、大衆點評這種須要多人次使用的app纔可盈利,大家有什麼推廣的計劃嗎?學習
- 答: 推廣計劃均在博客及項目計劃書中有體現,推廣的初期,咱們將在學校內宣傳,經過海報、網絡、自印宣傳單等方式,迅速擴大市場範圍。而且根據用戶的反饋信息,對軟件進行進一步的迭代更新。完善功能。接下來推廣到大學城內其餘幾所高校,進行下一步的更新和迭代。
進入到中期,積累了必定的用戶量和功能完善,咱們計劃擴大與商家合做,而且借用原先的客戶流量來完成進一步推廣。
有了以上的基礎,則進入軟件的上升期,具備較大的用戶量以後,用戶羣體也將產生必定的軟件依賴性,因此咱們計劃在客戶分享的內容的結尾帶上本軟件產品的宣傳標語, 達到擴大影響力的效果。
答第四組
答第五組
- 夜間手機拍照難以識別怎麼辦?
- 答: 首先感謝「起牀一塊兒肝活隊」的提問,可是提問能否適當結合生活實際呢?一家營業間的商鋪在夜晚確定是有開燈,考慮咱們的項目基礎即爲文字搜索功能,夜間拍照咱們也可經過調用手機附帶的手電筒實現。
- 關於水軍,若是連人腦都難以判斷是否爲水軍,算法能夠作到嗎?
- 答: 關於人腦與算法的差別性,或許該組對此有誤區。相似的功能如謠言檢測,設想一下,大部分人也很難區分謠言吧?相關具體可參見注意力模型的具體介紹,只是介於該模塊僅是附加功能,因此在本模塊上的時間分配不會過多,關於技術方面問題有興趣能夠後續私聊咱們團隊討論!
- 對於缺乏簡介與評論的商家應該如何解決?
- 答: 咱們主要針對的是城市廣場上的商鋪,而在大多數城市廣場的運營商均有需求對應商鋪提供相應簡介以與各大點評網站對接。若缺乏評論咱們能夠選擇不展現!這種不展現評論狀況也在大部分點評網站也均有出現。
答第六組
- 請問如何辨別水軍和用戶?
- 答: 首先感謝「404 Note Found隊」的提問,咱們的原先計劃是經過二分類形式的貝葉斯分類器來完成訓練的,通過組內討論也驗證了此方法過於簡單且數據集存在差別性問題,咱們也所以刪去了該功能。不過這裏我也想簡單提出一個彷佛可行的解決方案:經過網絡上常見的「模板」結合相關「水軍渠道」,以咱們團隊自身角度來標註「水軍」數據集,可是這個工做量實在偏大,所以不作考慮。
- 如何讓用戶放棄其餘產品而使用大家的產品?
- 答: 作好的本身的核心功能,加強競爭力。考慮的是作好本身,而不是逼用戶作出選擇,只要本身的產品夠好,用戶天然會投入咱們的懷抱。
3. 技術壁壘如何實現?測試
- 答: 既然談到技術模塊,咱們也就此展開討論,同時也期待貴團隊的迴應。首先咱們依據咱們的目標檢測算法展開,咱們經過構建金字塔特徵神經網絡FPN,並依此應用直推式遷移學習於COCO數據集中——每次測試將置信度較低的樣本重複訓練,訓練過程也借鑑殘差網絡Desnet的思想,各網絡層之間結合細粒度特徵與粗粒度底層特徵實現。若是感興趣歡迎討論!!!!而不是在答辯中要求咱們團隊當場講解最基礎的技術原理,首先咱們確定貴團隊有質疑咱們算法的權利,若是下次還有答辯機會的話,關於技術方面的問題能否事先對此模塊有所瞭解呢?對於技術的模塊的提問當然是一個極佳問題,咱們也很贊同,可是「槓精」式的提問真的對於你我團隊有益嗎?且提問中的「技術壁壘」是指全局的技術壁壘嗎?能否進一步說明,咱們好作進一步解答,不過上述提供的技術模塊也僅是咱們實現的技術中的「零星小點」,很遺憾因爲技術實現多屬本團隊隱私模塊沒法深刻解答。但願貴團隊能否在下次提問前多加思考呢?對於隱私性問題能否相對避免呢?
答第七組
- 對於夜晚環境暗,閃光燈補光無效,用戶使用的不是P20,是否是核心功能就失效了?
- 答: 通常用戶會選擇營業中的店鋪,黑燈瞎火的店鋪應該是沒辦法營業的吧。
- 若是採起了定位,使用搜索推薦附加商家的模式不會太花費時間,那麼大家的核心功能真的有吸引力嗎?
- 答: 核心功能是咱們本身定義的,咱們認爲這是咱們能夠吸引用戶的點,那麼您說有了一個更吸引的功能那麼我認爲這不是一個問題,而是一件好事。
- 對於沒有商店招牌的店鋪怎麼辦?以及大家要怎麼獲取商店迭代更替的信息?
- 答: 咱們的用戶場景主要針對的是城市廣場,那麼我認爲城市廣場內出現沒有商店招牌的店鋪是很好笑的。
答第八組
1. 對於項目的長海報功能,對於照片質量的保證和壓縮能到什麼程度網站
- 答: 首先感謝「小白吃」組的提問。沒能理解您的意思,「項目的長海報」這個功能咱們並無提過,也沒有相關表述,不知道是否是問題填錯了位置呢?咱們從未提到過長海報功能!
- 感受其實拍照功能是畫蛇添足的大家說打字時可能光線太暗,可是拍照的時候要是晚上也識別不清怎麼辦?
- 答: 通常用戶會選擇營業中的店鋪,黑燈瞎火的店鋪應該是沒辦法營業的吧。
- 感受大家對於算法主要是經過現成的目標檢測算法,可是後面更爲核心的卻沒有提到,對於大家之後可否真正推廣有把握嗎?
- 答: 首先咱們不只實現了目標檢測算法,還實現了相對的文字識別算法,試問每一個團隊是否均在實現算法徹底功能後再上臺答辯呢?咱們的核心內容即爲AR掃描+目標檢測+文字識別。不過AR模塊的話,google有提供開源的代碼,咱們也可藉此來改進。
答第九組
未提交問題
選題報告修改內容
- 根據上述提問,咱們均對選題報告進行了不一樣程度的修改,大體分爲如下三個模塊:
- 刪除「水軍」功能及其相關表述
- 選題報告格式規範化
- 修改團隊準則
平均分
本次整合各組打分,去除最高分及最低分,所得分數爲75.71
本次做業貢獻度
林燊 |
13% |
陳俞辛 |
16% |
朱志豪 |
8% |
蔡宇航 |
9% |
陳柏濤 |
10% |
董鈞昊 |
16% |
劉宏巖 |
12% |
盧愷翔 |
8% |
楊喜源 |
8% |
總計 |
100% |
說明:本次做業沒有出現扣貢獻度的狀況。考慮到本次做業以文檔爲主,因此製做文檔的同窗貢獻度較高。