您現在的位置是:首頁 > 棋牌

被捅的馬蜂窩:融資暗戰和五毛黨江湖

  • 由 黑奇士 發表于 棋牌
  • 2022-08-09
簡介黑奇士採訪了相關專家,對於UGC網站如何防範爬蟲和惡意內容:頂象技術專家田際雲指出,“爬蟲”不僅能夠抓取旅遊使用者評價和賬戶資訊,更可以爬取商品或服務的類目、圖片、價格等關鍵資料

蜂窩指令碼怎麼換賬號

2017年12月12日,成立11年的老牌旅遊網站馬蜂窩宣佈獲得D輪鉅額融資,淡馬錫、今日資本等合計投資1。33億美元。

彼時投資界雖有“過冬”的聲音,但仍然經常有幾千萬美元融資的案例出現。

9個月之後,馬蜂窩再次傳出需要下一輪融資的訊息,他們希望以20-25億美元的估值來獲得3億美元。

D輪之後,一般來說股票比例(利益分配)已經相對固定,出讓13%的股票換取現金,這個出讓比例近乎砍手斷腳,背後的潛臺詞是:馬蜂窩需要更多的錢來燒,否則可能有崩潰的危險。

可惜,現在的2018,再不是嘴上喊過冬,而是所有人都沒錢了。

被捅的馬蜂窩:融資暗戰和五毛黨江湖

(馬蜂窩創始人呂剛)

在這種環境之下,爆文《估值175億的馬蜂窩 竟是一座殭屍和水軍構成的鬼城》在週末刷爆朋友圈,就顯得特別的意味深長。

是誰捅了馬蜂窩,是誰在有計劃有目的的打壓一個獨角獸的估值……在其尋求下一輪鉅額融資的當口?

黑奇士(id hqssima)將抽絲剝繭,帶你分析整個事件。

旅遊網站抄襲餐飲點評?

眾所周知的是,馬蜂窩以旅遊攻略見長。

2006年1月上線,2010年3月正式投入公司化運營。4年時間裡,馬蜂窩攢了15萬活躍使用者。

以這種“慢公司”的勁頭,如果馬蜂窩要抄襲,應該是抄襲給他帶來最大利益的部分。

在乎睿資料提供的材料中,7000多個有抄襲嫌疑的賬號,搬運的卻是餐飲類內容點評。在自媒體“小聲比比”和其資料提供團隊“乎睿資料”共同製作的爆文中,並未提出合理解釋。

(圖片來自小聲比比)

餐飲類點評有助於馬蜂窩來鞏固自己的“旅遊攻略之王”地位嗎,這種抄襲的目的何在?當然,這種抄襲有另外的暗黑解釋,我先把他放在這裡,後文會揭開這種抄襲可能存在的原因。

揭黑背後的融資暗戰

自2017年開始,廣大吃瓜群眾看到,財大氣粗的投資人、外表光鮮的創業者和縱橫捭闔的巨頭之間,因為利益而爆出的一幕幕黑暗融資戰鬥:

在被美團收購表決會議上,摩拜的投資人、創始人同床異夢心懷鬼胎;

OFO一波三折的賣身投票,阿里、滴滴和戴威之間的爾虞我詐,在這些過程當中,不斷有媒體爆出“黑幕”,甚至有人拿出OFO的財務資料去打壓其估值和現金流,迫使其賣身求存;

錘子科技不斷爆出的“現金流枯竭”、“裁員”等,彷彿一直掙扎在死亡邊緣;

……

這些技倆之後,有的投資人用揭黑來打壓企業估值,以求在下一輪融資中用更少的金錢來佔據更多份額;

有的是創業者想獨立運營,不想投入巨頭懷抱,巨頭以揭黑來脅迫其出售股份;

還有的是巨頭A用揭黑來打壓企業現金流,避免讓巨頭B在收購戰中佔據先機;

如此種種,但凡創業者對其江湖黑暗有一點點幻想,就會被嚴酷的現實來打臉。

只是不知道,這次馬蜂窩遇到的,是黑暗套路的哪一種。

被捅的馬蜂窩:融資暗戰和五毛黨江湖

爬蟲之戰

網路爬蟲,又被稱為網頁蜘蛛、網路機器人,是按照一定的規則,自動地抓取網路資訊的程式或者指令碼。

比如,創業公司想做個旅遊網站,自己一窮二白毫無內容可言,怎麼辦呢?爬蟲這個大殺器就被拿出來。

只要普通網民能看到的內容,爬蟲就可以“看到”,可以複製和黏貼,從各大網站抓來內容填充自己的網站。只要抓取幾天,一個像模像樣的網站就可以製作完成,真實使用者來以後,也不會發現破綻。

被捅的馬蜂窩:融資暗戰和五毛黨江湖

不少創業公司的基礎內容(或者巨頭的創業專案),都是網路爬蟲來完成。

從乎睿資料爆出的證據來看,有兩個合理猜測:要麼是馬蜂窩在啟動餐飲點評專案的時候,抓取了其餘友商的資料來填充;

但是乎睿資料沒提供內容時間對比,兩個網站內容相同,可能是A抄襲B,也可能是B抄襲A,或者是第三方同時在兩個網站建立賬號,就像黑奇士在新浪搜狐等十多個網站發文,拿我的賬號說新浪抄襲搜狐,那不就不對了。

去年11月,黑奇士寫過一篇揭露旅遊網站流量黑幕的文章:《機票暗黑江湖:訂票網只有10%真流量 低價票根本買不著》,專家揭露說,旅遊網站的低價機票有不少被代理商爬蟲搶走,普通使用者根本訂不到。

爬蟲的用途之廣泛,是普通網民無法想象的。

五毛黨江湖

除了爬蟲之外,另外的一個合理猜測,是有不法團隊在做惡意內容,企圖在馬蜂窩“養號”,也就是所謂的“五毛黨”。

這個是網際網路上灰色產業一種,比如在微博初起時,有人建立幾百個賬號,專門從youtube上搬運內容,把自己養成微博大V,紅了之後可以獲取每年幾百萬、上千萬的廣告收入。

被捅的馬蜂窩:融資暗戰和五毛黨江湖

(網路炒作始祖,策劃人“立二拆四”在法庭受審)

黑奇士瞭解到,凡是依靠使用者產生內容的平臺,都會有這種“五毛黨養號團隊”出現,無論新浪微博、微信公眾號這樣的綜合平臺,還是汽車之家、大眾點評這樣的垂直網站,都有養號團隊出沒。

即使養的號沒成大V,用來做“五毛黨”也是很好的生意,通常來說,活躍賬號都有更高權重,用來貼有利於商家的評論、或者打壓對手,這些賬號都是最好的載體。

“養號”,可以解釋為什麼一個賬號即可以在廣州陪老公吃飯,又在天津訂了豪華酒店,因為這些飯店、酒店,就是他們的金主,每一個評論可以賺取最低5元、高則幾百元的費用。

同理,抽獎抽中殭屍使用者,實在是非常非常正常的事。公司做一次轉發抽獎,參與的真實使用者僅有幾百個,殭屍使用者幾萬幾十萬,結果獎品被殭屍使用者背後的操縱者領走。

(我自己就曾在新浪微博被殭屍使用者煩死:拿出幾萬元抽獎,使用微博官方抽獎平臺,轉發四十萬,漲了二十多萬粉絲。結果微博官方把我管理的賬號進行了封禁,理由是“購買殭屍粉絲”。

自此之後,微博一生黑。

括號裡這段話是我的親身經歷,無法遵守新聞平衡原則,望讀者周知。)

這隻能說,馬蜂窩封禁殭屍使用者不利,不能證明這些殭屍使用者是馬蜂窩官方養的。

防範暗箭明槍,還需武功更強

當然,本次馬蜂窩殭屍使用者事件,上述分析並不能完美解釋所有疑點。

比如,為什麼普通網友很難搶到的低價產品,自家員工卻可以輕易買到,這其中是否有內部腐敗?

因此,希望馬蜂窩自身進行嚴格核查,對乎睿資料指出的7000多個賬號進行檢查,最簡單的就是:公佈這些賬號的登陸IP和內容操作軌跡,看他們是從哪裡登陸的,必要時要提起法律訴訟。

黑奇士採訪了相關專家,對於UGC網站如何防範爬蟲和惡意內容:

頂象技術專家田際雲指出,“爬蟲”不僅能夠抓取旅遊使用者評價和賬戶資訊,更可以爬取商品或服務的類目、圖片、價格等關鍵資料。資料是網際網路平臺的重要資產。這些“爬蟲”的非法操作不僅竊取了平臺的資料資產,消耗了網站和平臺的服務和頻寬資源。

頂象資料反爬解決方案能夠有效防止各類非法爬取行為和惡意爬蟲。該方案在登入端部署頂象的智慧無感驗證,直接攔截爬蟲對重點資料的爬取。同時,結合頂象裝置指紋和實時風險決策系統,實現對於爬蟲的總體攔截。再基於對抗過程中的資料積累,利用智慧分析平臺對資料進行分析,建立基於符合業務場景和需求的風控策略,實時最佳化風控效果,良好防範資料遭惡意爬取的風險。

除了技術對抗之外,遭到爬蟲抄襲的公司還可以拿起法律武器來維護自己的利益:

2017年10月,今日頭條前員工宋某和侯某,因為使用爬蟲技術爬取今日頭條的影片內容,被北京市海淀區人民法院判處9個月至1年不等的有期徒刑。

該判決使宋某和侯某創立的公司直接進入死亡狀態。

被捅的馬蜂窩:融資暗戰和五毛黨江湖

(宋某因使用爬蟲爬取今日頭條影片內容而被判刑)

黑奇士採訪的法律界人士表示,隨著《網路安全法》的嚴格實施,以往看起來只是技術對抗的爬蟲和反爬,很容易觸犯刑法,受到刑事制裁。例如有的使用者賬戶包含住址資訊、釋出的內容包括電話、住址等敏感資訊,這些資訊被爬取之後,就可能觸犯刑律。

(如果您的公司遇到爬蟲困擾,或者遇到“五毛黨”,可以來找我聊聊。搜尋“黑奇士”,就可以找到我)

Top