1. 求問什麼叫市場調查樣本指標
隨機抽樣調查
(一)含義與類型
在市場調查中,無論是全面調查還是非全面調查,都有可能發生誤差,調查誤差是指調查的結果和客觀實際情況的額出入和差數。一般有兩種誤差存在:即登記性誤差和代表性誤差。
抽樣誤差的大小,主要受以下三個因素的影響:
1、被研究總體各單位標志值的變異程度。總體的方差和均方差越大,抽樣誤差就越大;反之,則抽樣誤差越小。如果總體各單位標志值之間沒有差異,那麼,抽樣指標和全及指標相等,抽樣誤差也就不存在了。
2、抽取的調查單位數目。在其他條件不變的情況下,抽樣單位數越多,抽樣誤差就越小,反之,則越大。當樣本單位數擴大到與全及總體數一致得失後,也就是全面調查,抽樣誤差也就不存在了。
3、抽樣調查的組織形式。抽樣誤差也受抽樣組織形式的影響,一般來說,按照等距抽樣和類型抽樣方式組織抽樣調查,由於經過排隊,可以縮小差異程度,因而抽取相同數目的樣本,其抽樣誤差要比簡單隨機抽樣方式的誤差小。
(二)抽樣誤差計算
1、抽樣平均誤差
在抽樣調中,往往可以根據調查的需要,從同一全及總體中抽取很多樣本,每個樣本都有相同的或不同的樣本容量,同時,每個樣本都可以計算相應的抽樣平均數或抽樣成數,這樣,從理論上講,可以計算出許多抽樣誤差,為了反映這些誤差的一般水平,就要計算抽樣平均誤差。
抽樣平均誤差是指所有樣本抽樣的平均數。它不是一個簡單的算術平均數,而是抽樣平均數或抽樣成數的標准差,即可能出現的樣本直白哦的平均離差。因此,抽樣平均誤差被用作衡量樣本指標對總體指標代表性高低的尺度。
2、極限抽樣誤差
抽樣平均誤差可以用來測定抽樣指標對總體指標的可能離差。根據概率原理。用一定的概率可以保證抽樣誤差不超過某一給定范圍,這個給定的范圍就叫做極限抽樣誤差。
中心極限定理已證明,概率度t和概率p成函數關系,即P=F(t),t每取一個值,都有唯一確定的P值與之相對應。在實際工作中,為了使用的方便,將不同的t值與其相應的概率P預先算好,編成概率表,供調查時使用。
2. 在做市場調查的時候怎麼避免不同因素帶來的誤差
前期的調查對象要准確定位
定位好的調查對象 進行科學的抽樣內
問卷的設計包括里容面的語言要設計標准 准確無異議
不同的調查方法會有不同的誤差影響
調查結束後 要對問卷進行抽查檢驗,對被訪者進行個簡單的回訪確認
最後市場調查本身就允許有誤差的存在,通過上述方法是降低人為非隨機誤差,隨機誤差是無法避免的
3. 開店前如何進行市場調查
1、市場調查對象應包括消費者情況、競爭者情況以及行業周邊環境的基本狀況等等一系列將內與創業密切相關的方容面。
2、開店之前,對於該地區內的各種條件,諸如商圈內的消費購買能力、競爭店的營業狀況等,必須經由調查結果,進行研究分析,以作為設店時營業額預測及決定創業規模的參考。
3、然後重點在於企業具體的商品構成、定價及促銷策略的確定,所以此階段應該提供深入分析消費生活方式及確定企業格調等方面的基礎資料。
(3)市場調查誤差擴展閱讀:
市場調查是指用科學的方法,有目的、系統地搜集、記錄、整理和分析市場情況,了解市場的現狀及其發展趨勢。
為企業的決策者制定政策、進行市場預測、做出經營決策、制定計劃提供客觀、正確的依據。
消費者調查:針對特定的消費者做觀察與研究,有目地的分析他們的購買行為,消費心理演變等等。
4. 市場調查與預測中的抽樣平均誤差怎麼算公式是什麼
市場調查的概念
又稱市場調研,它是應用各種科學的調查方式方法,搜集、整理、分析市場資料,對市場的狀況進行反映或描述,以認識市場發展變化規律的過程
2、市場預測的概念
是根據市場過去和現在的表現,應用科學的預測方法對市場未來的發展變化進行預計或估計,為科學決策提供依據
市場調查和市場預測的作用主要表現在以下幾個方
面:
市場調查與預測區別
1市場調查和市場預測為制訂科學的計劃和政策提供依據
2市場調查和市場預測是管理決策和提高經濟效益的必要條件
3市場調查和市場預測對社會生產的合理化起促進作用
4市場調查和市場預測對促進和滿足消費需求的顯著作用。
1 市場營銷調研是指個人或組織為某個特定的市場營銷問題的決策所需開發和提供信息而引發的判斷、收集、記錄、整理、分析、研究市場的各種基本狀況及其影響因素,並得出結論的系統的、有目的的活動與過程。
市場調查與市場預測的關系 一、兩者的共同點 1、主體相同 主要是企業
2、客體相同
都是市場或有關部分
3、功能和作用相同
都是為科學的營銷決策和制定營銷計劃提供依據
4、本質相同
都是屬於市場信息工作范疇 二、兩者的區別 1、出發點不同
市場調研的出發點是通過對市場的過去和現在狀況的調查研究,達到了解歷史,認識現狀,掌握市場發展變化的軌跡、特點和規律的目標。
市場預測的出發點是依據對市場歷史和現狀的認識,達到預計、認識未來,掌握市場的未來發展趨勢的目標。
抽樣平均誤差的計算
(一)樣本平均數的平均誤差
以μx表示樣本平均數的平均誤差, 表示總體的標准差。
5. 怎樣減少市場調研誤差
大量的一手數據------要求客觀
用SPSS統計軟體
不同行業調研方法不一樣,誤差也就不一樣.
調查者本身的知識面.綜合素質
6. 市場調研中的流失誤差是什麼,名詞解釋。
也就是樣本流失,對整個調研造成的誤差
7. 教材出版業的市場調查、評估和預測方法
教材出版業的市場調查、評估和預測方法
摘要
本題是一個設計型題目,題目有數據量大,信息多的特點。
首先,我們分析資料庫中數據,按一定規則將各大學排序,採用系統隨機抽樣的方法,外加地域性修正,把市場調查的范圍從205所高校縮小到26所 。針對此26所學校進行問卷調查。我們分析調查所得數據,對於某出版社的市場份額,用與該出版社相關的問卷數與總問卷數的比值來衡量,從而得到三年各出版社市場份額的數據表格,並利用擬合的方法進行預測。
其次,我們還考慮到了問卷抽樣調查過程中有可能出現的特殊情況,即:抽樣無回答情況。我們利用兩種補救無回答的二級抽樣調查方法對此問題進行了解決,傳統方法和貝葉斯方法,並對它們之間的異同作簡略的概括和比較。此兩種方法均是為降低非抽樣誤差、提高數據質量服務的。
再次,我們還提出了對按需印刷理論的新理解,從而大大減少了出版社的成本投入。在數據的驗證中,我們將通過抽樣調查得出的市場份額與分析總體得到的市場份額進行比較,求出相對誤差。發現絕大多數數據誤差不超過0.1,效果較好。在模型改進中,也提出了改進模型的新思路。
最後,我們還對題目進行了更加完備的討論和使用說明,並在此題的基礎上對出版社提出了意見和建議。
關鍵詞: 系統隨機抽樣 地域性修正 補救無回答 二級抽樣調查方法 按需印刷理論
一、問題背景
隨著黨中央國務院「十一五」發展規劃的提出,我國的文化產業也受到了前所未有的重視,同時,「十一五」也宣告了出版產業面臨著前所未有的挑戰。 「十一五」期間,出版發行業將面臨網際網路、手機簡訊、數字出版等科技發展引發的對出版環境的影響,不少出版社和發行單位已經或者正在開始著手對自身未來發展的思考和規劃,這種現象本身也是出版業理性回歸的一個重要標志。對於出版發行單位而言,戰略規劃的最大價值在於它的過程,在於培養一種在市場經濟環境中的系統思考與應變能力,而不僅僅是規劃的結果。根據加入WTO的承諾,2006年是我國出版分銷行業全面放開的最後一年,深化體制改革以應對入世,正在成為出版發行行業的重中之重。行業對競爭力的關注前所未有的重視,任何研究報告、市場調查、行業排名都會觸動出版社敏感的神經。教育出版對出版社的競爭力影響大,經營成為最主要的提高競爭力的手段,形成了相對穩定的競爭力優勢。因此,占據出版業優勢地位的教材出版業更注重對市場的調查研究,對市場作出科學的評估和預測,我們需要的就是一種科學的調查、評估和預測方法。
二、問題重述
某出版社出版多類高等教育和職業教育的教材。從出版社的戰略發展、投資策略、生產安排、銷售方式、和產品策劃等業務考慮,需要對出版社的市場佔有率(市場份額)及其逐年變化進行調查。請你設計有效而可行的調查方法,並且建立調查數據的分析模型,以及對市場作出科學評估和預測的方法。
本題的附錄中給出的基礎數據是問卷式普查數據,由於抽樣成本的限制,普查是不可取的,而且抽樣數應該在調查目的的基礎上盡量少。
題目說明
1. 由於抽樣成本,普查不可取,但是抽樣方法的樣本數和調查效益之間有平衡關系,確定你的抽樣數時應該考慮這種平衡關系。
2. 完整地描述你的調查方法,並且清楚地給出你的模擬數據。如果使用問卷式抽樣調查(不限於問卷式),請給出問卷格式。
3. 給出基於調查數據的市場評估和預測模型,並用數據說明你的方法的有效性和科學性。
4. 在附錄1中給出了一個參考的問卷格式,也給出與該問卷相關的一個資料庫(附錄4)。這個資料庫是包含十個省,全部學生(為了減少數據量,假定全班學生填表相同,因此每個專業只有一個學生填寫問卷)的模擬答卷(包括三年的),作為本競賽題的背景數據
5. 附錄2中給出供本題提供的資料庫的29類教材名稱以及分類號,附錄3給出某出版社各類教材的三年銷售量,可供查詢。
6. 在附錄4中也給出十個省所有學校名稱以及其專業名稱,你可以用在這些檢索詞確定你對資料庫的取樣查詢。
7. 如果你自行選用數據,請給出調查數據的可靠性和合理性的檢驗方法和數據來源。
三、基本假設
為了便於我們從題目的整體理解,從出版社的戰略發展、投資策略、生產安排、銷售方式和產品策劃等業務考慮,對出版社的市場佔有率(市場份額)及其逐年變化進行調查。從而設計有效而可行的調查方法,並且建立調查數據的分析模型,以及對市場作出科學評估和預測的方法。我們在此做出合理的基本假設:
(1)在相當長的一段時期內教材出版業的市場是基本穩定的;
(2)社會環境穩定,社會政策關於出版業方面無較大調整;
(3)教育部門對教材的應用無較大變化;
(4)學校各專業無較大的變化,學校的人數不會有大幅度的增加或減少;
(5)教材出版社的數量基本穩定,經營狀況起伏不大;
(6)出版社的經營情況良好,無意外事件發生;
(7)教材出版社出版的教材質量有保證,無質量問題;
四、問題的分析與模型的准備
一、問題的分析
鑒於本題的附錄中所給出的數據較多,有:
(1)在附錄1中給出了一個參考的問卷格式;
(2)在附錄2中給出供本題提供的資料庫的29類教材名稱以及分類號;
(3)在附錄3給出某出版社各類教材的三年銷售量,可供查詢;
(4)在附錄4中給出十個省三年的原始數據以及相對應的學校專業名錄;
(5)還可自行選用數據。
而且,題目中要求基礎數據是問卷式普查數據,由於抽樣成本的限制,普查不可取,抽樣數應該在調查目的的基礎上盡量少,所以,我們從以下方面考慮,處理數據,解決問題:
首先,我們分析資料庫中數據,按一定規則將各大學排序,採用系統隨機抽樣的方法,外加地域性修正,把市場調查的范圍從205所高校縮小到26所 。針對此26所學校進行問卷調查。我們分析調查所得數據,對於某出版社的市場份額,用與該出版社相關的問卷數與總問卷數的比值來衡量,從而得到三年各出版社市場份額的數據表格,並利用擬合的方法進行預測。
其次,我們還考慮到了問卷抽樣調查過程中有可能出現的特殊情況,即:抽樣無回答情況。我們利用兩種補救無回答的二級抽樣調查方法對此問題進行了解決,傳統方法和貝葉斯方法,並對它們之間的異同作簡略的概括和比較。此兩種方法均是為降低非抽樣誤差、提高數據質量服務的。可以說在模型的應用一個非常好的補救方案,使我們的模型更加完整,更具有有效性和科學性。
再次,我們還提出了對按需印刷理論的新理解,從而大大減少了出版社的成本投入。在靈敏度分析中,我們還利用某出版社的數據對模型進行了驗證,將模型推廣到一般。
最後,我們還對題目進行了更加完備的討論和使用說明,並在此題的基礎上對出版社提出了意見和建議。
二、模型的准備(名詞解釋)
1、數據壓縮
數據壓縮是以信息損失最小為前提,簡化或壓縮數據以提高其傳輸、存儲和處理效率的一種技術。考慮到數據量相當龐大,需要獲取和處理的數據量較多,數據壓縮是減少工作量、節省計算機時間的有效方法。可通過去掉間隔、空白段、冗餘項目或不必要數據,只保留反映特徵的數據等手段實現,達到在給定空間內增加所能存儲的數據量,減少數據量所佔的空間。數據壓縮方法通常有:①削減。用外延或內插方法推算冗餘數據並將其去掉;②參數抽出。即僅保留特徵數據和參數;③等時間采樣。按等時間間隔對連續輸入的數據進行采樣;④編碼變換。將數據變成簡化代碼,或對每個數據塊進行編碼變換,其效率用每個像元的比特數來衡量;⑤函數應用。根據由等間隔或不等間隔采樣得到必要的采樣點,用函數演算法推算出削減的數據。
2、無回答
所謂無回答是指出於某些原因,不能從所有的樣本單位或問卷的所有問題中獲得所需的信息。它可以是樣本單位沒有提供或者沒有完全提供所需的信息,可以是所提供的信息中有一部分無法使用。無回答的調查者與回答的調查者通常具有不同的特徵,因此如果對無回答不進行糾正的話,將會降低樣本的有效性和代表性,使調查估計值產生偏差,從而降低調查的精度,甚至導致整個調查的失敗。
3、二級抽樣方法
二級抽樣方法是人們常用的一種處理無回答問題的方法,它的基本思想是:對最初的無回答進行再一次的隨機抽樣,然後用最初樣本的回答數據和子樣本數據對總體進行估計,以消除無回答的偏差影響,提高估計量的精度。這種方法常用於郵寄調查中。下面我們將介紹兩種補救無回答的二級抽樣調查方法:傳統方法和貝葉斯方法,並對它們之間的異同作簡略的概括。
4、按需印刷
按需印刷(Print On Demand,簡稱POD)的本意是指按照不同時間、地點、數量、內容的需求,通過數碼及超高速挽印技術實現出版行業整個流程的全新改造來適應個性化、短版化、高效率的現代市場需求。它尤其適用於一些定向較窄、專業性強、可變性強、批晝較小的印刷業務。按需印刷是先進的資料庫技術和數字印刷技術相結合的產物。其操作過程是先將圖書內容數字化,然後用電子文件在專門的激光列印機上高速印製書頁,並完成折頁、配頁、裝訂等工序。它具有印刷時間上的即時性,印刷數量、印刷內容的可變性和個性化等特點。
在此,我們利用它的引申意,按照市場所需的教材的數目進行印製。由於各高校對於教材的需求種類不同,所以,很需要這么一種模式來滿足客戶的需求,因此,我們在此提出按需印刷模式。
同時,按需印刷採用即時供貨結賬的方式,使出版社節省了圖書儲存空間。實現「零庫存」,而且還能解決圖書絕版及印數問題。通過按需印刷,出版社可擺脫圖書印刷、庫存、運輸、投資所帶來的資金風險和發行量的壓力,節省成本。
五、模型的建立與預測
(一)、抽樣調查方法的陳述
我們的抽樣調查可分前期、中期、後期三個工作階段,即「樣本-數據-分析」。前期工作是進行抽樣設計獲得調查單位名單,解決向誰搜集統計資料的問題(樣本);中期工作是對抽選的調查單位進行統計調查,獲得統計數據並對數據進行必要整理,提供准確的、可供統計分析的數據,解決數據獲取和數據格式問題;後期工作是利用統計軟體對調查和整理得到的數據進行統計分析,得出科學的分析結論,達到統計工作的最終目的(分析)。三者相輔相成,缺一不可。
抽樣調查所考慮的問題在實際抽樣調查中無外乎包括以下三個方面: 調查指標估計的精度;調查成本的高低;樣本的容量。在抽樣調查方案設計中以上三個方面是相互矛盾的。因此,在抽樣調查方案設計中應當根據實際對以上三個方面問題進行重要性排序,一般情況下,調查指標估計的精度是最重要的,其次應當考慮調查成本,最後再考慮樣本容量。
所以, 抽樣調查方案設計中三個問題的優先順序:
( I 是優先順序)
以下是我們歸納的抽樣調查的步驟:
5.1、抽樣的目的
抽樣的目的是從已有的普查資料庫中選取有代表性的數據,即數據壓縮。通過數據壓縮,得到誤差允許范圍內的數據,從而對市場進行科學的評估和預測。
5.2、抽樣的基本原則
為了掌握市場的情況,所抽得的數據應該具有全面性和代表性,這是抽樣的基本原則。
5.3、常用的抽樣方法(簡述)
抽樣方法可分為概率抽樣和非概率抽樣兩大類。由於非概率抽樣結果的可能性不能准確地計量,一般都使用概率抽樣方法,簡單隨機抽樣、分層隨機抽樣和系統隨機抽樣均屬概率抽樣方法。
1. 簡單隨機抽樣
簡單隨機抽樣是指「從含有N 個個體的總體中抽取n 個個體,使包含有n 個個體的所有可能的組合被抽取的可能性都相等」。採用此方法抽樣時,資料庫中的每個數據被抽入樣本的機會均等,它是完全不帶主觀限制條件的隨機抽樣法。它是一個基本的隨機抽樣方法,也是其他隨機抽樣方法的基礎。
2. 分層隨機抽樣
有時產品可分為若干層,各層產品質量存在明顯的差異,為了取得有代表性的樣本,把整批產品分為若干層,使同一層內產品質量盡可能均勻整齊,在各層內分別隨機抽取一些產品,合在一起組成一個樣本,這樣的抽樣方法叫分層隨機抽樣。在正確分層的前提下,分層抽樣的代表性比簡單隨機抽樣好,但是如果對批質量的分布不了解或分層不正確,則分層抽樣的效果會適得其反。
3. 系統隨機抽樣
如果一個批的產品可按一定的順序排列,並可將其分為數量相當的n 個部分,從每個部分按簡單隨機抽樣方法確定的相同位置,各抽取一個單位產品構成一個樣本,這樣的抽樣方法稱為系統隨機抽樣。它的代表性在一般情況下比簡單隨機抽樣要好些,但在產品質量波動周期與抽樣間隔相當時,抽到的樣本單位可能都是質量好的或都是質量差的產品,此時代表性就較差。
5.4、抽樣方法的正確選擇
為了更好的評估和預測市場,選擇合適的抽樣方法是非常重要的。
1. 當數據比較穩定,數據並不多時,選擇簡單隨機抽樣,在對總體質量一無所知的情況下,也應選擇簡單隨機抽樣。
2. 當不同的數據來自不同的地域時,為了取得有代表性的樣本, 可以採用分層隨機抽樣。
3. 當數據不穩定,中間相差較大時,應採用系統隨機抽樣。
根據實際情況, 選擇正確合理的抽樣方法,提高樣本的代表性和隨機性, 從而提高抽樣的有效性, 是十分重要的。只有科學、合理、有效地實施抽樣,才能使我們的要求得以實現。
為此,我們針對此題數據多,地域性廣,各類書籍需求量相差很大等特點,綜合考慮三種抽樣方法,採取以系統抽樣為主,其它抽樣為輔的方法,利用數據壓縮解決抽樣問題。
同時,我們還應用了Excel軟體,Excel軟體在統計分析方面的功能雖不及專業統計軟體(如SPSS、SAS等),但它那強大的、靈活易用的數據管理和整理功能是專業統計軟體所不能及的。因此,我們在處理數據方面較多的利用了Excel軟體,使我們的處理數據的速度大大加快。
抽樣調查問卷採用題中給出格式。
(二)、模型的建立
首先,我們從資料庫中查詢出一些有用數據,先寫在下面。
1.學科類別 29類
2.出版社數目 25個
3.大學數量 205所 ,各個省市對應的大學數量見下(表一):
北京 廣東 河北 安徽 河南 福建 廣西 甘肅 貴州 海南
49 30 26 24 24 14 13 12 9 4
(表一)
4.基於資料庫中全部數據,每一年收回問卷數中與該出版社有關的問卷數目,見(表二):
出版社 第一年與出版社有關的問卷數目 第二年與出版社有關的問卷數目 第三年與出版社有關的問卷數目
p196 325 323 327
p559 328 336 346
p106 353 352 351
p199 380 379 393
p307 406 411 418
p102 444 451 452
p131 476 475 472
p511 490 495 503
p030 497 503 512
p063 506 508 515
p416 640 637 635
p304 654 661 666
p110 747 754 764
p246 773 778 781
p432 871 870 868
p091 910 913 913
p118 1002 1015 1031
p210 1308 1311 1308
p044 1606 1604 1602
p390 2041 2035 2025
p405 3098 3162 3227
p534 4021 4001 3983
p293 5095 4947 4767
p115 18267 18116 17967
p357 20490 20646 20812
(表二)
分析:題目說明4中,說明了一份問卷的意義。在一份問卷上出現一個出版社的名字,說明填寫該問卷的學生所在的整個專業,使用該出版社的教材。我們可以假設,總體上說,專業平均的人數相同,則某一年與某出版社對應的問卷數目越大,在該出版社購書的人越多,說明該出版社的市場佔有率越大。
5. 基於資料庫中全部數據,可以考察每一年各個大學的購書情況。我們可以統計出各個大學的學生填寫問卷的數目。根據我們的假設,問卷數越大,學校對書的需求量越大。
我們按不同大學對應的問卷數目降序排列。同時,經分析發現,各大學三年的問卷數目並沒有發生變化,因此各大學的排名也不會發生變化,因此,三年的問卷數目都可以按第一年的情況考慮。
由於大學數目有205所,我們分析得到的各大學排名數據仍然很多,在這里我們省略。
下面我們來分析每一個問卷數目段中的大學數量:見(表三)
某大學的填寫問卷數目 大學的數量
700~799 1
600~699 7
500~599 34
400~499 34
300~399 39
200~299 38
100~199 20
0~99 32
(表三)
據此,我們採取系統隨機抽樣,對於按填寫問卷數目降序排列的205大學,將其分為數量相當的26個部分(按照排名,每8個學校為一個部分,前25部分滿額,第26部分有空缺)。對於每個部分,採用簡單隨機抽樣確定相同的位置(本題選用每一部分的第一個位置)。
下面我們來考察我們現在確定的方案是否符合數據的「全面性、地域性和代表性」
見(表四)
省份 北京 廣東 河北 安徽 河南 福建 廣西 甘肅 貴州 海南
共有大學數量 49 30 26 24 24 14 13 12 9 4
選取大學數量 7 4 3 5 1 3 0 1 1 1
(表四)
從表格中我們看出,個別數據並不能很好的體現地域性和代表性。我們需要對系統隨機抽樣的結果作出人為的微調。舉例來說,我們可以把某一所安徽省的學校換為和它排名相差較小的廣西省的學校。
最後,我們確定的學校數量如下(表五):
省份 北京 廣東 河北 安徽 河南 福建 廣西 甘肅 貴州 海南
共有大學數量 49 30 26 24 24 14 13 12 9 4
調整後選取大學數量 6 4 3 3 3 2 2 1 1 1
(表五)
最終我們所選出來具體的大學,結果見下(表六):
鄭州大學 福州大學 廣西民族學院 北京理工大學 中國農業大學 貴州工業大學 河北農業大學 北京聯合大學
河南省 福建省 廣西 北京市 北京市 貴州省 河北省 北京市
744 597 552 542 519 507 470 451
續上表
海南大學 廣西師范大學 茂名學院 鄭州航空工業管理學院 北京廣播學院 商丘師范學院 湛江師范學院 北京機械工業學院
海南省 廣西 廣東省 河南省 北京市 河南省 廣東省 北京市
414 405 385 369 342 305 301 276
續上表
唐山師范學院 河西學院 仲愷農業技術學院 巢湖學院 福建醫科大學 北京電子科技學院 安徽醫科大學 安徽中醫學院
河北省 甘肅省 廣東省 安徽省 福建省 北京市 安徽省 安徽省
253 239 208 204 138 103 77 68
續上表
中國人民武裝警察部隊學院 廣州體育學院
河北省 廣東省
35 32
(表六)
總結我們的調查方法,是:在205所學校中,選取部分學校作為代表,接受問卷調查。學校的選取方法為:總體採用系統隨機抽樣的方法,但為了保證「全面性、地域性和代表性」,也對抽樣方法作了一些修正。我們選取了如上26所高校作為發放調查問卷的對象。
下面,我們根據上述調查方法,從資料庫中分別找出第一年26所大學對應每個出版社的問卷數目。我們採用Excel軟體進行處理,得出第一年每個出版社對應26所大學的問卷數目的和。
對應表格如下(表七):
出版社 P559 P199 P102 P106 P196 P307 P304 P030 P131 P511 P063 P416
問卷數目 38 45 47 47 49 55 59 64 67 68 72 85
續上表
P110 P246 P091 P118 P432 P210 P044 P390 P405 P534 P293 P115 P357
88 99 118 119 119 160 204 266 378 515 631 2507 2657
(表七)
我們利用Matlab軟體,也表示出了第一年每一個出版社對應的問卷數目與總問卷數目的比值如下(表八):
出版社 P559 P199 P102 P106 P196 P307 P304 P030 P131 P511 P063 P416
問卷比例 0.0044 0.0053 0.0055 0.0055 0.0057 0.0064 0.0069 0.0075 0.0078 0.0079 0.0084 0.0099
續上表
P110 P246 P091 P118 P432 P210 P044 P390 P405 P534 P293 P115 P357
0.0103 0.0116 0.0138 0.0139 0.0139 0.0187 0.0238 0.0311 0.0442 0.0602 0.0737 0.2930 0.3105
(表八)
基於原來的假設和說明,我們可以用它來考察市場佔有率。相應的,也可以求出第二年,第三年每一個出版社對應的問卷數目與總問卷數目的比值。
下面給出第二年的結果,見(表九)
出版社 P559 P199 P106 P102 P196 P307 P304 P131 P030 P511 P416 P110
問卷比例 0.0044 0.0051 0.0055 0.0058 0.0061 0.0065 0.0069 0.0072 0.0076 0.0083 0.0098 0.0105
續上表
P063 P246 P432 P118 p091 P210 p044 P390 P405 P534 P293 P115 P357
0.0107 0.0118 0.0138 0.0141 0.0139 0.0185 0.0259 0.031 0.0447 0.0595 0.0711 0.2886 0.3123
(表九)
六、模型的誤差分析
運用Matlab軟體,可以求出基於資料庫全部數據時,每一年每一個出版社對應的問卷數目與總問卷數目的比值。
對於我們的采樣方法,以第一年為例,我們可以計算兩個比值之間的相對誤差,以此來檢驗我們的方法。
表格見(表十)
P196
p559 p106 P199
p307 p102 p131 p511 p030 p063 p416 p304
標准 0.0049 0.0050 0.0054 0.0058 0.0062 0.0068 0.0072 0.0075 0.0076 0.0077 0.0097 0.0100
測量 0.0057 0.0044 0.0055 0.0053 0.0064 0.0055 0.0078 0.0079 0.0075 0.0084 0.0099 0.0069
誤差 16.3% 12.0% 1.8% 8.6% 3.2% 19.1% 8.3% 5.3% 1.3% 9.1% 2.1% 31%
續上表
P110 p246 p432 p091 p118 p210 p044 p390 p405 p534 p293 p115 p357
0.0114 0.0118 0.0133 0.0138 0.0152 0.0199 0.0244 0.0311 0.0471 0.0612 0.0775 0.2779 0.3117
0.0103 0.0116 0.0139 0.0138 0.0139 0.0187 0.0238 0.0311 0.0442 0.0602 0.0737 0.2930 0.3105
9.6% 1.7% 4.5% 0 8.6% 6% 2.5% 0 6.2% 1.6% 4.9% 5.4% 0.4%
(表十)
由上面表格可以看出,除個別組外,其餘各組的相對誤差均小於0.1。可見我們的方法在精度要求范圍內較好。
七、模型的驗證及改進
從出版社的角度考慮,在印刷方面,我們提出按需印刷理論。為了驗證模型的有效性和科學性,我們按地區劃分,將10個省市三年的售書情況進行了統計,然後我們利用Excel軟體對數據進行了處理,並作出直觀的圖表,藉以26所大學的選取進行驗證。
某出版社三年內在10個省市的售書情況:
1. 表格見(表十一):
北京市 廣東省 河南省 河北省 安徽省 福建省 甘肅省 廣西省 貴州省 海南省 合計
第一年 3934 2837 2544 2374 1998 1400 1136 1017 844 290 18374
第二年 3902 2809 2533 2354 1980 1396 1133 1017 838 282 18244
第三年 3870 2773 2504 2315 1963 1378 1122 1009 830 283 18047
合計 11706 8419 7581 7043 5941 4174 3391 3043 2512 855 54655
平均值 3902 2807 2527 2348 1981 1932 1131 1015 838 285 18222
排名 1 2 3 4 5 6 7 8 9 10
(表十一)
由表格我們可以看出:
(1)10個省市,每個省市三年中書的銷售數量基本相同,每年數量相差不大;
(2)在三年中,每一年,10個省市書的總銷售量基本相同,平均每年銷售18222冊;
(3)通過三年的比較,可以得出10個省市每年的售書情況及其排名。
2.作圖如下:
(圖一)為三年10各省市的售書情況的自然條形圖
(圖一)
(圖二)為三年10各省市的售書情況的比例圓餅圖
(圖二)
通過作圖,我們可以看出:
(1)北京市三年內售書最多,達到了21.4%;廣東省其次,達到了15.4%;河南省緊跟其後,達到了13.9%;它們三個省市的售書量已達到50.7%,超過了一半。
(2)北京市、廣東省、河南省、河北省、安徽省、福建省五省的售書量均超過 10%,其五省的總銷售量達到了74.5%。
我們根據(附錄),可以求出基於我們的模型,P115出版社各個省份所佔的百分比,如下(表十二)
省份 北京 廣東 河北 安徽 河南 福建 廣西 甘肅 貴州 海南
百分比 25.4% 10.2% 10.2% 4.7% 18.1% 7.9% 10.4% 3.3% 4.5% 5.4%
(表十二)
可以看出,和圓餅圖相比,一些省份的數據有所出入。
據此,我們找到了模型的改進方向。在選取大學的時候,不僅做到系統隨機抽樣和地域性修正,還要做到各個省份學校分布相對均衡。這樣所得結果必定效果更好。
八、模型的補救方案
在這里,我們將介紹兩種補救無回答的二級抽樣調查方法:傳統方法和貝葉斯方法,並對它們之間的異同作簡略的概括。
一、傳統的二級抽樣方法
傳統的二級抽樣方法最早由Hansen和Hurwitz提出來的。它以傳統的統計推論為基礎,用簡單隨機的抽樣的方法對總體進行第一次抽樣,取得回答單位的觀測值及回答單位權重的估計,然後在無回答單位中再隨機抽出一個子樣本進行調查,取得無回答單位的信息,最後把這兩部分調查結果結合起來,對總體作出推斷估計。這種方法實際上是一種分層的二級抽樣,總體被分為兩層,即回答層和無回答層。
設總體容量為N,其中有 個回答者和 個無回答者, ,隨機抽取最初樣本,樣本容量為 ,其中有 個回答者,樣本均值為 ;有 個無回答者, 。然後從 中隨機抽取一個子樣本 ,其抽樣比 ,樣本均值為 。總體回答率 ,總體無回答率為 , 。則二級抽樣總體均值的估計量為: (1)
根據二級抽樣的抽樣方差公式可得:
(2)
其中, 是樣本方差, 是無回答層的方差。
可以看出,總體方差的第一項受最初樣本 大小的影響,而第二項不僅受 的影響還受無回答者子樣本抽樣比 的影響。當 時,方差第二項為零,就是說所有調查者都進行了回答,收集到了全部的數據,它相當於樣本量為 的簡單隨機抽樣。
由於考慮上面方差公式中 項與樣本的分配無關,所以改寫成:
(3)
如果考慮二級抽樣中兩次調查的費用差異,則總費用函數可記為:
(4)
其中 為最初樣本每單位的調查費用, 為
8. 市場調研與預測知識點:1:誤差的來源2:評價一份問卷好壞的標準是什麼
市場調研質量問題本質上是誤差問題, 即市場調研所提供的數據與客觀實際數量特徵之間的差距
問題。它包括兩部分, 即抽樣誤差和非抽樣誤差。抽樣誤差可以用公式計算, 大小可以通過調整樣本容量或改變抽樣方式來加以控制, 而非抽樣誤差既難以計算又難以控制, 已成為影響調研結果可靠程度的重要原因。非抽樣誤差最容易出現在數據收集階段, 在這一階段調查者和被調查者都會產生各種各樣的非抽樣誤差。下面我們對其做一下分解分析, 以探求預防和控制這些誤差的方法和措施, 使之降至最小, 從而提高市場調研的質量。
一、非抽樣誤差的產生
產生在數據收集過程中的非抽樣誤差, 從誤差來源來說, 包括調查者誤差和非調查者誤差, 從性質
上來看, 又可以分為故意誤差和非故意誤差。
( 一) 調查者誤差
調查者誤差, 是指進行問卷調查時由於調查者的原因所產生的誤差。在數據收集階段, 調查者自身
的素質和能力直接影響著數據的真實性和准確性, 即產生誤差的大小。調查者誤差有些是在無意中產生的, 有些則是主觀故意造成的, 具體表現可以分為以下兩種情況:
1. 故意誤差
由於調查者自身素質低, 工作不負責任, 為了完成任務, 有意欺騙。因為現在一般的報酬體制是按訪談完成的問卷份數計算工作量, 他或她上交的只是完成的調查問卷。有的訪問者自己以被訪者的身
份填寫問卷, 以達到省時、省力、騙取報酬的目的。有的雖然也進行實地訪問, 但對被訪的內容偷工減料, 該向被訪者展示圖片的, 可能不展示, 匆忙念完問題, 不等被訪者回答, 就告訴被訪者如何選擇, 以壓縮進程, 明明大約30 分鍾左右完成的內容, 五六分鍾草草訪畢。這些故意欺騙造成了極大的非抽樣誤差, 使調研形同虛設, 造成了極大的資源浪費, 也失去了它的本來意義。
2. 非故意誤差
由於調查者在調查時工作馬虎、粗心大意而發生的漏填、錯填、筆誤等而使資料缺乏准確性, 從而造成登記性誤差; 訪問者的某些個性特徵, 如口音、性別及舉止行為等也會影響數據的准確性, 造成非抽樣誤差。比如, 訪問者帶有濃重的口音, 會造成訪問者與被訪者之間的語言交流障礙, 被訪者可能聽不清或聽錯, 進而造成非故意誤差; 如果被調查者是一位女士, 且單獨在家, 而訪問者是一位男士, 被訪者可能拒訪, 或有壓力感, 草草應付了事; 如果訪問者舉止不夠穩重, 令被訪者產生反感, 自然也不會爭取被訪者的合作。再有, 調查者在訪問時自認為按要求進行, 實際上卻違規操作。例如, 訪問員在訪問時不能保持中立, 對被調查者的回答會自覺不自覺地點頭表示贊同或搖頭暗示其答案不正確或重填, 或者進行誘導式提問。還有可能, 被調查者在思考時, 調查者在旁邊不停地解釋或提示答案如何選擇。這些情況多半是培訓不到位或被調查者缺乏相應的專業技能而造成的非抽樣誤差。如果訪問者受過良好的訓練明知道這樣做不對, 還要這樣做, 那就應歸入調查者故意誤差了。
( 二) 被調查者誤差
被調查者誤差是指被調查者在接受調查時有意或無意地提供了無效的或不真實的數據, 相比之下,
被調查者誤差更難以控制, 它也可以分為兩種情況:
1. 故意誤差
被調查者故意誤差是指其有意不合作、拒訪或由於某種原因故意說謊而產生的誤差, 具體如下:
( 1) 不響應。是指預先選定的被調查者不參與調查或不回答調查問卷中的某些特定問題。實際上,
各種類型的不響應是調研人員所遇到的最常見的被調查者故意誤差。某些觀察家認為, 調研業目前正面臨艱難時期, 因為公眾越來越不願意參與調查, 因為他們越來越忙以及需要保護隱私。日益降低的合作率正在深刻地改變著調研業的面貌, 每一項實際執行的調查活動一般都要遇到不響應的情況, 特別是拒訪的情況。
( 2) 說謊。當被調查者不願說出真相時, 說謊就產生了。對於那些敏感性問題或涉及個人隱私的問
題, 被調查者一般不願如實回答問題, 例如, 對許多人來說, 收入問題是一個敏感性問題, 對某些人來說,年齡問題也是一個敏感性問題, 對單身女士暴露婚姻狀況是其擔憂所在。
2. 非故意誤差
被調查者提供了無效的答案或不確切、不真實的數據, 而他或她卻認為提供的是事實, 就產生了被
調查者非故意誤差, 主要表現為被調查者在沒有理解問題或對問題產生誤解的情況下所做的答案。這種問題有的是與被調查者自身的理解能力有關, 有的則可能是問卷設計有問題而導致理解偏差, 還有可能是因為調查者訪問不當, 進行誘導式提問而影響調查數據的真實、准確, 從而產生非故意誤差。當被調查者在沒有把握的情況下回答的問題, 可能出於猜測而非事實本身, 也會產生非故意誤差; 要求沒有說清楚或沒有按要求回答問題及被調查者的筆誤等都會產生被調查者非故意誤差。
調查問卷設計質量指的是: 通過問卷測量得到的, 反映調查對象客觀現象的統計數據的准確性和有效性, 即調查問卷設計質量的好壞, 需要通過問卷測量能力的高低來檢驗。除了調查時採用的抽
樣方法以及所抽取的調查對象是否具有代表性之外, 調查者最關心的就是調查問卷的測量能力。問卷測量能力包含了兩個方面的內容, 即問卷測量結果的准確性和有效性。准確性和有效性是統計數據質量蘊涵的最主要的兩個特性, 一個好的調查問卷設計不僅可以保證在多次重復使用下得到可靠的數據結果, 即准確性; 也可以保證所得測量結果能夠反映它所應該反映的客觀現實, 即有效性。
9. 定性分析與定量分析的異同及優缺點
定量分析和定性分析在不同領域的具體應用手段有所不同。
在分析化學中,分析的目的是為了獲取某個物體的信息,這樣的物體包括固體、液體、氣體以及生物大分子。而獲取的信息則包括物理化學方面的一些特徵,或者是蛋白質的序列,這也是分析化學的大概內容。
相信大家看出來了,定量分析是化繁為簡,我們從不同的量之間最終得到了一條簡單深刻的規律;而定性分析則恰恰相反,它揭示了世界的復雜性,所以這二者在方法論上有根本的區別,這也是為何稱其「三觀」不同的原因了。