文獻標識碼: A
文章編號: 0258-7998(2014)03-0137-03
隨著移動互聯網的飛速發展,移動廣告市場取得了巨大飛躍,在美國排名前50位的廣告主中,有80%的廣告主計劃在未來12~18個月的時間內增加其在移動廣告領域的支出預算。因此如何建立起一個擁有更高用戶參與度和更多流量的移動在線平臺成為當前面臨亟待解決的問題。
目前,智能手機、平板電腦等移動設備應用廣泛,移動智能終端設備的使用量迅速上升。但是,很多移動廣告的推送和表現形式生硬呆板,嚴重影響了用戶的體驗,阻礙了廣告投放的效益。隨著技術的發展,出現了更加豐富多樣的展現形式,伴隨著終端應用的社交化、多媒體化,廣告主更加重視移動應用平臺的廣告投放。移動終端的反饋速度、互動社交、隨時隨地和精準的特點都是其他媒體無法比擬的,移動應用平臺廣告提供了個性化、多樣化的營銷廣告模式。
本文著重研究基于位置和內容定向的廣告投放技術,提出了一種新的基于內容定向和位置信息的廣告投放模型[1],主要包括:(1)針對用戶移動終端所在地理位置,判別與此地理位置相關的廣告; (2)對于同一個廣告,提供與此相關的多個地理位置,由此可為每個應用頁面和廣告都分配一個地理范圍,提高地理信息匹配的準確性;(3)根據移動用戶應用軟件使用習慣和內容,研究基于內容定向的精準投放算法,可以有效提高匹配準確性。本文對上述方法進行研究,并設計出高效精準的移動應用平臺廣告投放系統, 能有效提高廣告投放功能。
1 廣告投放關鍵技術研究
廣告投放的目的是根據廣告主的需求對用戶進行廣告推送,定向廣告是廣告投放應用的一項關鍵技術。定向廣告投放包括內容定向和行為定向,其目的就是將特定的廣告投放給特定的人群。移動應用廣告投放是指根據用戶使用移動應用的習慣,確定廣告的受眾對象,對用戶進行群體劃分,并根據用戶群體特點進行高效精準的廣告投放。
本文結合內容定向和地理位置構建高效精準的移動應用平臺廣告投放系統。
1.1 基于貝葉斯技術的內容定向廣告過濾算法
貝葉斯理論的含義是通過已知事件信息預測未知事件的發生概率[2]。將貝葉斯理論運用到廣告投放的過濾算法中,假設某些字詞經常出現在用戶使用的應用軟件中,這些文字作為已知文字,當廣告中含有這些字詞時,用戶對此廣告感興趣的概率就較高。
(1)已知文字信息的貝葉斯數據創建
首先收集用戶經常在移動應用平臺瀏覽和使用的數據(非隱私數據),通過貝葉斯算法提取這些數據中的關鍵字樣本,樣本字符串包括文字或符號標志(如IP地址,域名等)。收集關鍵字和符號,建立已知文字信息樣本數據庫。
(2)貝葉斯概率數據庫創建
根據用戶瀏覽信息,對每個已知文字符號在用戶最近瀏覽和使用的應用軟件中出現的概率進行統計,并由貝葉斯公式計算出在廣告文字中出現某些文字符號的概率,得出該廣告為用戶感興趣廣告的概率。例如:在1 000個采集樣本中“裙子”出現了80次,而在其他不經常訪問的頁面中這個詞出現了5次,則其對應的感興趣的概率為0.888 9(備注:[80/1 000]/[5/1 000+80/1 000])。
(3)創建個性化的貝葉斯庫
由于不同用戶的偏好是不同的,例如,年輕的女性用戶經常訪問購物應用,關注社交應用的購物和時尚主題等,則“衣服”等關鍵詞出現的幾率很高,但是男性則多訪問新聞、游戲等應用。如果不區分用戶群,使用統一的關鍵詞過濾,就會產生很多誤判,影響廣告投放的效率。因此,在貝葉斯算法過濾的基礎上,建立貝葉斯已知文字信息數據庫的同時,按照用戶群體進行貝葉斯庫的統計和創建。這樣感興趣廣告的識別率將更高,同時也使得誤判率變得很低。
貝葉斯過濾算法[3]的主要思想是在已知的大量用戶信息中,包含一些特征串(token),這些特征串可以簡單地理解為一個完整的單詞,但實際上它不僅僅限于單詞,它們出現在用戶瀏覽信息中的頻率特別高,而在一些其他應用中,另一些特征串出現的頻率也很高。一般而言,對于同一個特征串出現在不同用戶群體中的概率是不同的。因此,對于出現的每一個特征串,都會生成一個用戶群體感興趣指示性概率。這樣就可以判斷文本消息的整體“用戶感興趣概率”。
1.2貝葉斯方法過濾廣告的基本原理
貝葉斯方法過濾廣告的基本原理為:
(1)收集大量的不同用戶群體的信息,建立用戶感興趣的廣告集合和用戶不感興趣的廣告集合。
(2)提取用戶信息中的關鍵字和獨立文字作為令牌串,并統計其出現次數(字頻)。
(3)對每個集合設立一個哈希表,哈希表中存儲令牌串與字頻之間的映射關系。感興趣集合的哈希表為hashtable_yes,不感興趣的集合對應哈希表hashtable_no。
(4)令牌串概率P=(令牌串的字頻)/(令牌串所在哈希表的長度),由此統計出每個哈希表中令牌串的出現比率。
(5)綜合考慮感興趣集合和不感興趣集合的哈希表,當用戶訪問一個應用時,推斷用戶感興趣廣告的集合,并判斷某個廣告為用戶感興趣廣告的概率。數學表達式為:
A事件為用戶感興趣廣告;t1,t2,…,tn為令牌串,則P(A/ti)表示在廣告中出現令牌串ti時,該廣告為用戶所感興趣廣告的概率。
(6)通過設立新的哈希表 hashtable_probability來存儲TOKEN令牌串ti到P(A/ti)之間的映射關系。
(7)根據建立哈希表來預測用戶對該新廣告感興趣的概率。
1.3 結合地理位置信息的內容定向廣告投放算法
基于地理位置信息的廣告投放算法,結合內容定向,通過獲取用戶所在的地理位置,計算廣告與地理位置的相似度,通過獲取用戶所瀏覽信息中的地理位置,并通過文本處理來計算用戶移動應用內容與廣告的內容相似度。最后,結合地理相似度和廣告相似度來計算用戶應用信息與廣告之間的最終相似度,并根據排序挑選出最匹配的應用信息與廣告[4]。
算法處理步驟如下:
(1)根據用戶移動終端所獲得的地理位置,確定移動應用與地理位置的相關度。
(2)分別對移動應用(移動瀏覽器網頁)等文本和廣告文本做如下處理:
①通過貝葉斯技術選取用戶移動應用內容的特征,確定用戶瀏覽關注的應用信息關鍵詞;
②對關鍵詞做語義擴展,包括同義詞與近義詞;
③估算關鍵詞的特征權重;
④抽取用戶所在地理位置,擴展地理位置特征,分配地理范圍;
⑤根據地理位置特征,調整地理位置與用戶瀏覽內容主題的相關度。
(3)根據用戶的地理位置和廣告的地理范圍,計算地理相似度。
(4)計算用戶所瀏覽內容與廣告內容的相似度。
(5)將內容相似度和地理相似度線性組合,計算廣告與用戶關注信息的最終相似度。
2 移動應用平臺廣告投放系統設計
2.1 需求分析
(1)功能性需求分析
①投放計劃模塊:該模塊主要用于實時接收廣告投放計劃,并根據投放計劃的變更情況,動態地對服務器中的廣告訂單項目進行增、刪、改、暫停和啟用,從而完成對廣告投放的控制。
②廣告投放模塊:主要用于接收來自不同移動應用終端的廣告請求,并對這些請求參數進行分析,根據貝葉斯理論查找用戶感興趣的廣告并發送給移動終端,同時能夠處理大量的終端請求。
③投放分析模塊:該模塊主要用于接收來自終端的廣告投放報告,并將廣告投放的詳細數據信息存入日志庫中。
④管理員可以將廣告投放服務器注冊到指定的管理中心及日志服務器上,從而使管理中心取得對該廣告投放服務器的投放控制權,日志服務器可以從該廣告投放服務器中獲取對應的投放詳細報告和日志。
⑤投放配置模塊:為了實現熱切換,廣告投放模塊需要能夠動態獲取相關配置文件。
(2)穩定性需求分析
①投放模塊不能下發可能會導致移動應用終端異常的信息。
②數據同步過程中,要能夠正常處理客戶端的廣告請求,并保證平滑地完成數據同步。
③當廣告投放模塊出現問題時,需要能夠馬上完成下線工作,并通過Email或短信通知管理人員。
④異常自動修補:通過收集相關地域定向信息,實現對請求異常的自動修補。
(3)可擴展性需求
①當業務流程出現變化時,系統應能通過簡便方法實現業務節點的增刪。
②投放配置模塊應能靈活地實現對不同客戶渠道的流程配置。
2.2 系統架構設計
在移動應用平臺廣告投放系統中,視圖層包括輸入和輸出兩方面信息:(1)輸入:用戶瀏覽移動應用和移動終端網頁的信息;(2)輸出:即系統通過搜集用戶瀏覽的內容進行數據挖掘,確定與用戶興趣點最相關的精準廣告投放,并通過視圖層進行展示。
控制層是系統的核心,完成用戶瀏覽數據搜集,以及用戶特征模型的建立/更新、用戶的分類及廣告投放等功能。
底層模型層提供數據保存服務,主要包括用戶數據表,廣告表及信息表等庫表和視圖數據。系統架構設計如圖1所示。
系統首先通過搜集移動客戶端用戶的瀏覽信息,并采用貝葉斯技術對用戶瀏覽的內容進行分類,之后將用戶特征信息保存到用戶檔案中。此時根據用戶所屬群體,判斷用戶的IP和其他信息,創建用戶檔案[5]。
根據用戶特征,對用戶和廣告進行相似性分析,得到位置相似度和內容相似度,計算用戶信息與廣告的總體相似得分,最后選擇最匹配的廣告進行投放。系統處理流程如圖2所示。
本文針對移動應用廣告投放技術進行研究,著重研究了基于位置和內容定向的移動互聯網廣告投放技術,構建出高效精準的移動應用平臺廣告投放系統。從而為移動廣告主帶來更加豐厚的廣告效益,從而產生更大的經濟價值。
參考文獻
[1] OGILVY D. Confessions of an advertising man[M]. New York:Southbank Publishing,2004.
[2] 戴浩.圖像存儲與傳輸系統在iPad上的設計與實現[J].微型機與應用,2013,32(19):25-27.
[3] 王利民.貝葉斯學習理論中若干問題的研究[D].吉林:吉林大學,2005.
[4] 黃秀蓮. 我國手機廣告發展現狀及前景預測研究[D]. 廈門:廈門大學,2008.
[5] 郭泉成, 劉鈺, 劉紅,等.基于WAMP的遠程醫療咨詢系統的設計與實現[J]. 微型機與應用,2013,32(19):13-16.