保險(xiǎn)新投保數(shù)據(jù)研究分析

時(shí)間:2022-06-23 09:39:52

導(dǎo)語:保險(xiǎn)新投保數(shù)據(jù)研究分析一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

保險(xiǎn)新投保數(shù)據(jù)研究分析

[摘要]以四川某保險(xiǎn)公司的新投保數(shù)據(jù)研究對(duì)象,使用SPSS作為工具,對(duì)該公司年度新投保數(shù)據(jù)進(jìn)行分析研究,通過相關(guān)性分析、探索分析、線性回歸分析找出總保費(fèi)和各個(gè)變量間的關(guān)系,幫助公司找尋最優(yōu)方案,調(diào)整或改善策略以增加盈利。

[關(guān)鍵詞]數(shù)據(jù)分析;保險(xiǎn);新投保數(shù)據(jù)

疫情的爆發(fā),自然災(zāi)害的頻繁出現(xiàn),使得不確定風(fēng)險(xiǎn)因素增加,對(duì)人們的生活產(chǎn)生較大的影響。投保可以在災(zāi)難發(fā)生時(shí),對(duì)人們的生活有一定的保障[1]。如今保險(xiǎn)業(yè)積累的大量數(shù)據(jù)在大數(shù)據(jù)技術(shù)的沖擊下又是一個(gè)新的風(fēng)口。保險(xiǎn)行業(yè)希望通過利用新技術(shù)的運(yùn)用在逆境中尋求更大的發(fā)展就成為了一種必然[2]。保險(xiǎn)的本質(zhì)是要求保險(xiǎn)產(chǎn)品確定尚未發(fā)生的風(fēng)險(xiǎn)。在風(fēng)險(xiǎn)預(yù)測(cè)過程中,往往需要將數(shù)據(jù)信息與相應(yīng)的分析技術(shù)結(jié)合起來,這就需要大數(shù)據(jù)分析來提高風(fēng)險(xiǎn)預(yù)測(cè)的準(zhǔn)確性[3]。研究新投??蛻?,建立客戶畫像,是抓住老客戶、增加新客戶的有效方法,因此,要分析客戶選擇投保的因素,以及能增加盈利的因素。了解后公司就能針對(duì)性地調(diào)整策略,推出更符合消費(fèi)者需求的產(chǎn)品。推出更多符合不同情況的大眾保險(xiǎn),提高保險(xiǎn)對(duì)大眾的受用程度和保障度,從而提高有效保險(xiǎn)的量,使得雙方受益程度實(shí)現(xiàn)最大化。

1.研究思路

分析工具采用SPSS軟件。SPSS(StatisticalPackagefortheSocialScience)軟件是世界上著名的統(tǒng)計(jì)分析軟件之一,2000年SPSS公司由于產(chǎn)品升級(jí)及業(yè)務(wù)拓展的需要,將其產(chǎn)品正式更名為SPSS(statisticalproductandservicesolutions),即統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案[4]。分析思路如下:以四川省某保險(xiǎn)公司的新投保數(shù)據(jù)為研究對(duì)象,采用SPSS作為分析工具,對(duì)數(shù)據(jù)中年齡,性別,婚姻狀況,險(xiǎn)種類型,保費(fèi)等數(shù)據(jù)進(jìn)行分析比對(duì),對(duì)新投保的客戶進(jìn)行畫像,分析保險(xiǎn)的選擇是否和客戶的某種特征有關(guān),從而可以對(duì)不同的客戶選用不同的策略幫助公司收獲新客戶,也幫助新客戶選擇出好產(chǎn)品,實(shí)現(xiàn)雙方共贏。

2.數(shù)據(jù)說明

數(shù)據(jù)來源于四川某保險(xiǎn)公司年度新投保數(shù)據(jù)。其中包含了機(jī)構(gòu)、險(xiǎn)種、投保時(shí)間、繳費(fèi)方式、繳費(fèi)期限、投保份數(shù)、總保費(fèi)、保額、客戶號(hào)、性別、年齡、婚姻狀況、過去三年平均年收入、教育程度、職業(yè)、家庭人口。共16列900648行。進(jìn)行數(shù)據(jù)清洗,因?yàn)樵谛畔r(shí)代,數(shù)據(jù)即是資源。數(shù)據(jù)可靠無誤才能準(zhǔn)確地反映現(xiàn)實(shí)狀況,有效地支持組織決策[5]。因此首先應(yīng)該做的就是篩選有用的數(shù)據(jù),剔除無用數(shù)據(jù);還包括空值的清理,無效值、異常值的刪除。

3.數(shù)據(jù)分析

3.1總保費(fèi)與職業(yè)、年齡等變量的相關(guān)關(guān)系

由于本數(shù)據(jù)集所持有的數(shù)據(jù)含有一定量的臟數(shù)據(jù)以及無效數(shù)據(jù),為提高分析的準(zhǔn)確度和有效度,所以在進(jìn)行數(shù)據(jù)分析之前,需要做出一定的數(shù)據(jù)清洗與處理,即刪除數(shù)據(jù)中不正確填寫的教育程度、家庭人口列。用SPSS中的自動(dòng)重新編碼功能將字符串類型的值轉(zhuǎn)換為數(shù)字類型,便于后續(xù)的分析操作。然后進(jìn)行數(shù)據(jù)分析,首先將變量測(cè)量類型更改為標(biāo)度,然后通過相關(guān)分析得出與總保費(fèi)相關(guān)性較高的變量(見表1)。結(jié)果顯示,其中與總保費(fèi)相關(guān)性系數(shù)較高的變量有險(xiǎn)種、繳費(fèi)方式、性別、婚姻狀況、職業(yè)、保額、年齡、過去三年平均年收入、機(jī)構(gòu)、繳費(fèi)期限,其中年齡和保額的相關(guān)性最強(qiáng),為正相關(guān);相關(guān)性系數(shù)較低的有投保時(shí)間、投保份數(shù)、客戶號(hào)。由此可得出年齡與總保費(fèi)相關(guān)性強(qiáng),呈正相關(guān)。說明年齡大的人群在保險(xiǎn)方面的支出大,而較年輕群體在保險(xiǎn)方面的支出則較少。因此保險(xiǎn)公司可以通過將年齡較大人群喜愛的產(chǎn)品進(jìn)行改進(jìn)或是保持其特色來穩(wěn)固在這一方面的收入;通過推出更適合較年輕人群的例如理財(cái)方面的產(chǎn)品來增加較年輕群體這部分的收入。保額與總保費(fèi)相關(guān)性強(qiáng),呈正相關(guān)。說明人們對(duì)保險(xiǎn)的投入與他們期望的保額有很大的關(guān)系,因此可以通過人們對(duì)保額的期望來增加產(chǎn)品的競(jìng)爭(zhēng)力或是以此來推薦與客戶期望值相匹配的產(chǎn)品。

3.2具體分析總保費(fèi)與年齡的關(guān)系

上文我們得出了總保費(fèi)和年齡有很強(qiáng)的相關(guān)性,因此我們將年齡分化,進(jìn)一步分析。首先通過SPSS軟件中的頻率分析的功能計(jì)算出年齡的四分位數(shù)從而進(jìn)行分組(見表2)。由此我們可以將年齡分為四個(gè)區(qū)間:34歲及以下設(shè)置為第一個(gè)年齡組---青年組并把該組數(shù)據(jù)全部重新編碼為1;35歲到40歲設(shè)置為第二個(gè)年齡組---壯年組,并把該組數(shù)據(jù)全部重新編碼為2;41歲到48歲設(shè)置為第三個(gè)組---中年組,并把該組全部數(shù)據(jù)全部重新編碼為3;49歲及以上設(shè)置為第四個(gè)組---老年組,并把該組數(shù)據(jù)全部重新編碼為4。將總保費(fèi)設(shè)為因變量、經(jīng)過重新編碼后的年齡段設(shè)置為因子進(jìn)行探索分析。分析結(jié)果得出:在4組年齡組中,5%剪除后平均值最高的組為第四組(49歲及以上),然后是第三組、第二組、第一組依次下降。這一結(jié)果也印證了上文所分析的年齡與總保費(fèi)的強(qiáng)相關(guān)性,年齡越大的人在保險(xiǎn)上的投入越多。其次中年組(41歲到48歲)的標(biāo)準(zhǔn)差最大,數(shù)據(jù)的離散程度最大,說明中年組對(duì)于不同價(jià)位的保險(xiǎn)選擇更為分散。4組數(shù)據(jù)的偏度均大于0,為右偏分布(均值>中位數(shù)>眾數(shù)),說明同組里高保費(fèi)的人較少,大部分人所交總保費(fèi)是低于平均值的。且4組數(shù)據(jù)峰度均大于0,為尖峰分布,說明樣本之間差異較大,右邊(高保費(fèi)區(qū)域)極端值較多,保費(fèi)更多地集中在眾數(shù)周圍。青年組的四分位距和標(biāo)準(zhǔn)差最小,保費(fèi)繳納情況最為集中。3.3總保費(fèi)與年齡、保額等變量的線性關(guān)系通過上文的相關(guān)性分析,我們已經(jīng)得出了與總保費(fèi)相關(guān)性較高的一些變量,下面我們找出是否這些變量具有某些線性關(guān)系。數(shù)據(jù)處理方面,線性回歸分析需要所有的參數(shù)都是屬于數(shù)字型的,然而險(xiǎn)種、繳費(fèi)方式、性別等變量都為字符型的變量,不能用于線性回歸分析,因此我們將險(xiǎn)種、繳費(fèi)方式、性別等變量自動(dòng)重新編碼。線性分析,首先我們得出以下模型摘要表(表3)。發(fā)現(xiàn)第7、8、9種模型R方最大,且第9種模型標(biāo)準(zhǔn)估算的錯(cuò)誤最小,所以最后選擇第九種模型進(jìn)行建模。接著是方差分析,發(fā)現(xiàn)顯著性都小于0.01,說明這些變量能夠建立有效模型。可以得出線性回歸方程的常量是:-147262.49,保額的系數(shù)為0.601,繳費(fèi)期限的系數(shù)為-760.667,繳費(fèi)方式(編碼為數(shù)字型)的系數(shù)為-5550.119,職業(yè)(編碼為數(shù)字型)的系數(shù)為8.701,年齡的系數(shù)為56.481,婚姻狀況(編碼為數(shù)字型)的系數(shù)為404.014,險(xiǎn)種(編碼為數(shù)字型)的系數(shù)為26.904,性別(編碼為數(shù)字型)的系數(shù)為105.779。得出如下線性回歸方程:總保費(fèi)=保額*0.601+繳費(fèi)期限*(-760.667)+繳費(fèi)方式*(-5550.119)+職業(yè)*8.701+年齡*56.481+機(jī)構(gòu)*0.442+險(xiǎn)種*26.904+性別*105.779-147262.49。從此線性回歸方程也能看出年齡與保額是和總保費(fèi)呈正相關(guān)關(guān)系的。分析結(jié)果表明,總保費(fèi)和年齡、保額等變量的關(guān)系,未重新編碼的變量中保額、年齡、繳費(fèi)期限對(duì)于總保費(fèi)的影響很大,客戶選擇產(chǎn)品時(shí)重點(diǎn)關(guān)注所選產(chǎn)品的保額和繳費(fèi)期限。限公司和客戶都能運(yùn)用這樣的方程針對(duì)自身的各項(xiàng)指標(biāo)來大致得出合適的保費(fèi),也能通過總保費(fèi)、年齡、職業(yè)等等指標(biāo)來計(jì)算大致能獲得的保費(fèi)。幫助公司和客戶實(shí)現(xiàn)共贏。

4.結(jié)論及建議

總保費(fèi)主要受年齡和保額的影響,且多數(shù)購買保險(xiǎn)的都是年齡較大的人群,較年輕群體購買保險(xiǎn)的情況最為集中,選擇的都是近似價(jià)格的產(chǎn)品,而較大年齡的群體購買情況就比較分散,形成此結(jié)果的原因大概是因?yàn)檩^年輕群體身體狀況較良好,且較為均衡,發(fā)病率較低,所以對(duì)于保險(xiǎn)的需求也較為均衡。而較大年齡群體的身體狀況較差、發(fā)病率較高且患病的情況更為復(fù)雜、離散,所以對(duì)于保險(xiǎn)的需求也有較大的不同,但較大年齡群體的平均保費(fèi)高于較年輕群體,說明目前保險(xiǎn)的需求量在較大年齡群體中高一些。保額對(duì)總保費(fèi)有較大影響,說明人們?cè)谫徺I保險(xiǎn)時(shí),對(duì)于該款保險(xiǎn)的保額在客戶心里的比重是很大的,能夠付出多大的保費(fèi)和人們心中想得到的保障有很大關(guān)系。公司在設(shè)計(jì)產(chǎn)品時(shí),建議針對(duì)不同年齡的人群來推出不同類型的產(chǎn)品。較大年齡人群依然占保險(xiǎn)市場(chǎng)的很大份額,想出更多辦法,結(jié)合保額對(duì)人們購買產(chǎn)品時(shí)的影響,推出更好的產(chǎn)品更能保持這一人群的支持。對(duì)于較年輕群體,市場(chǎng)的空間較大,推出針對(duì)年輕群體的產(chǎn)品,抓住較年輕群體的市場(chǎng),能進(jìn)一步提升公司盈利。

【參考文獻(xiàn)】

[1]陳英.大數(shù)據(jù)時(shí)代下保險(xiǎn)業(yè)發(fā)展趨勢(shì)及風(fēng)險(xiǎn)應(yīng)對(duì)策略[J].今日財(cái)富,2020(24):51-52.

[2]廖偉革.大數(shù)據(jù)支撐保險(xiǎn)業(yè)發(fā)展?fàn)顩r研究[J].現(xiàn)代經(jīng)濟(jì)信息,2019(04):361-363.

[3]李弘熙.淺析大數(shù)據(jù)背景下保險(xiǎn)業(yè)發(fā)展[J].中國(guó)集體經(jīng)濟(jì),2020(21):98-99.

[4]吳占福,馬旭平,李亞奎.統(tǒng)計(jì)分析軟件SPSS介紹[J].河北北方學(xué)院學(xué)報(bào)(自然科學(xué)版),2006(06):67-69+73.

[5]郝爽,李國(guó)良,馮建華,等.結(jié)構(gòu)化數(shù)據(jù)清洗技術(shù)綜述[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,58(12):1037-1050.

作者:王智毅 楊杉 單位:四川大學(xué)錦城學(xué)院計(jì)算機(jī)與軟件學(xué)院