分析人:BUPT_LX


研究目的

用某些算法对2014年12月份的16家国内A股上市的商业银行当中11项財务数据(资产总计、负债合计、股本、营业收入、流通股A、少数股东权益、净利润、经营活动的现金流量净额、投资活动的现金流量净额、筹资活动的现金流量净额、汇率变动对现金的影响)提取分析,得出股票价格的財务影响原因。更加清楚地指导银行股价与財务数据指标之间的联系。

研究方法

主要有描写叙述性分析、因子分析、回归法

方法概述:

1. 先对上述的財务数据进行提取。然后用常规的描写叙述方法(平均、最大、最小、方差等)对这些数据进行粗略分析。

2. 然后用因子分析得出对上市银行的股票价格影响较大的几个因子。从而更加详细地了解到上市银行股价的决定性因素(将几个因子进行业务描写叙述);

3. 最后用回归法确定这些因素对股票价格的影响强弱

研究工具

R语言

psych包/library(psych)用于因子分析

lmtest包用于回归检验

算法模型分析过程

1. 数据预处理

列出16家A股上市的银行

工商银行601398

农业银行601288

中国银行601988

建设银行601939

交通银行601328

民生银行600016

浦发银行600000

兴业银行601166

光大银行601818

平安银行000001

中信银行601998

招商银行600036

华夏银行600015

北京银行601169

南京银行601009

宁波银行002142

当中顺序相应于下表行1~16,財务数据相应于列1~11,当中单位为亿元

资产总计

负债合计

股本

营业收入

流通股A

少数股东权益

净利润

经营活动的现金流量净额

投资活动的现金流量净额

筹资活动的现金流量净额

汇率变动对现金的影响

股价

206000

191000

3535

6589

2680

64.5

2763

2015

-1467

1578

84.9

4.33

160000

149000

3248

5209

2842

15.5

1795

346

-1404

308

-5.7

3.05

153000

141000

2887

4563

2051

426

1772

1269

-2006

836

-123

3.7

167000

155000

2500

5705

95

102

2278

3170

-3439

-629

27.3

4.97

62700

57900

743

1774

327

25.5

660

497

-234

437

1.7

6.34

40200

37700

342

1355

225

76.1

456

2292

-2844

305

-1.25

7.03

42000

39300

187

1232

149.22

31.2

474

1912

-3425

729

10.7

13.146

44100

41500

191

1249

161.8

31.6

475

6821

-5662

1143

-1.4

13.54

27400

25600

467

785

398.1

5.08

289

347

-925

388

2.26

3.83

21900

20600

114

734

98.37

0

198

253

-545

312

3.25

11.46

44300

41500

468

1247

319

79.4

111

-311

-238

308

14

5.55

47300

44200

252

1659

206.29

6.56

560

2722

-1760

219

34.5

12.47

18500

17500

89.1

549

64.88

6.41

180

129

-202

111

0.98

11.39

15200

14300

106

369

89.68

0.23

156

1245

-545

130

1.08

9.08

5732

5404

29.7

160

29.69

3.35

56.6

1115

-1250

215

0.09

10.93

5541

5199

32.5

154

28.73

0.73

56.3

228

-626

333

-1144

10.49

data_bank<-read.csv("C:/Users/user/Desktop/bank1.csv")
##假设用summary(data_bank)会看到第一个元素min,第三个元素中位数。第四个元素平均值。第六个元素最大值。 我们对data_bank每一列做上述的操作,使得展现更为清晰。 #求每一个元素(財务指标)的样本数
N1<-length(data_bank[,1])
N2<-length(data_bank[,2])
N3<-length(data_bank[,3])
N4<-length(data_bank[,4])
N5<-length(data_bank[,5])
N6<-length(data_bank[,6])
N7<-length(data_bank[,7])
N8<-length(data_bank[,8])
N9<-length(data_bank[,9])
N10<-length(data_bank[,10])
N11<-length(data_bank[,11])
head<-c("变量名","资产总计","负债合计","股本","营业收入","流通股A","少数股东权益","净利润","经营活动的现金流量净额","投资活动的现金流量净额","筹资活动的现金流量净额","汇率变动对现金的影响")
sum1<-summary(data_bank[,1])
sum2<-summary(data_bank[,2])
sum3<-summary(data_bank[,3])
sum4<-summary(data_bank[,4])
sum5<-summary(data_bank[,5])
sum6<-summary(data_bank[,6])
sum7<-summary(data_bank[,7])
sum8<-summary(data_bank[,8])
sum9<-summary(data_bank[,9])
sum10<-summary(data_bank[,10])
sum11<-summary(data_bank[,11])
row2<-c("全距",sum1[6]-sum1[1],sum2[6]-sum2[1],sum3[6]-sum3[1],sum4[6]-sum4[1],sum5[6]-sum5[1],sum6[6]-sum6[1],sum7[6]-sum7[1],sum8[6]-sum8[1],sum9[6]-sum9[1],sum10[6]-sum10[1],sum11[6]-sum11[1])
row3<-c("最小值",sum1[1],sum2[1],sum3[1],sum4[1],sum5[1],sum6[1],sum7[1],sum8[1],sum9[1],sum10[1],sum11[1])
row4<-c("最大值",sum1[6],sum2[6],sum3[6],sum4[6],sum5[6],sum6[6],sum7[6],sum8[6],sum9[6],sum10[6],sum11[6])
row5<-c("均值",sum1[4],sum2[4],sum3[4],sum4[4],sum5[4],sum6[4],sum7[4],sum8[4],sum9[4],sum10[4],sum11[4])
row6<-c("中位数",sum1[3],sum2[3],sum3[3],sum4[3],sum5[3],sum6[3],sum7[3],sum8[3],sum9[3],sum10[3],sum11[3])
row7<-c("标准差",sd(data_bank[,1]),sd(data_bank[,2]),sd(data_bank[,3]),sd(data_bank[,4]),sd(data_bank[,5]),sd(data_bank[,6]),sd(data_bank[,7]),sd(data_bank[,8]),sd(data_bank[,9]),sd(data_bank[,10]),sd(data_bank[,11]))
result<-matrix(c(head,row1,row2,row3,row4,row5,row6,row7),nrow=8,byrow=T)
print(t(result))

能够看出这

1. 16家A股上市的银行净利润平均值在767亿,最小的56,3亿也是盈利的。说明效益还是比較稳定的;

2. 现金流量净额方面,经营活动收入的现金最多,而投资活动出去的现金最多。汇率变动使得现金有少部分亏损;

3. 资产-负债上整体保持资产高于负债近10个点。

二、以下进行因子分析过程

library(psych)#因子分析须要的库
KMO(data_bank[,-12])#减去股价那一列,做因子检验
#MSA为60%。说明这些变量适合做因子分析
fa.parallel(data_bank[,-12])#依据以下图我们选取主因子数量为2

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

#因子分析的算法
fa(data_bank[,-12],nfactors=2,fm="ml",rotate="varimax",score=T)
##Factor Analysis using method = ml
##Call: fa(r = data_bank[, -12], nfactors = 2, rotate = "varimax", scores = T,
## fm = "ml")
##Standardized loadings (pattern matrix) based upon correlation matrix
## ML1 ML2 h2 u2 com
##资产总计 0.98 0.20 0.998 0.0022 1.1
##负债合计 0.98 0.21 0.998 0.0021 1.1
##股本 0.98 0.07 0.974 0.0263 1.0
##营业收入 0.97 0.21 0.996 0.0041 1.1
##流通股A 0.84 -0.06 0.706 0.2941 1.0
##少数股东权益 0.48 0.08 0.240 0.7602 1.1
##净利润 0.96 0.25 0.981 0.0186 1.1
##经营活动的现金流量净额 -0.05 1.00 0.995 0.0050 1.0
##投资活动的现金流量净额 -0.03 -0.92 0.838 0.1618 1.0
##筹资活动的现金流量净额 0.19 0.29 0.116 0.8842 1.7
##汇率变动对现金的影响 0.21 0.22 0.091 0.9093 2.0
##SS loadings 5.76 2.17
##Proportion Var 0.52 0.20
##Cumulative Var 0.52 0.72
##Proportion Explained 0.73 0.27
##Cumulative Proportion 0.73 1.00
##Mean item complexity = 1.2
##Test of the hypothesis that 2 factors are sufficient. ##The degrees of freedom for the null model are 55 and the objective function was 33.64 with ##Chi Square of 353.17
##The degrees of freedom for the model are 34 and the objective function was 10.91 ##The root mean square of the residuals (RMSR) is 0.06
##The df corrected root mean square of the residuals is 0.07 ##The harmonic number of observations is 16 with the empirical chi square 5.45 with prob < ##1
##The total number of observations was 16 with MLE Chi Square = 99.97 with prob < ##2.1e-08 ##Tucker Lewis Index of factoring reliability = 0.579
##RMSEA index = 0.504 and the 90 % confidence intervals are 0.27 0.428
##BIC = 5.7
##Fit based upon off diagonal values = 0.99
##Measures of factor score adequacy
## ML1 ML2
##Correlation of scores with factors 1 1.00
##Multiple R square of scores with factors 1 1.00
##Minimum correlation of possible factor scores 1 0.99

从上述结果能够看出

1.ML1与ML2两个因子的累积贡献率有72%,说明两个因子能解释全部变量72%的信息

2.各个因子与两个变量的关系:

资产总计=0.98ML1+0.20ML2

负债合计=0.98ML1+0.21ML2

股本=0.98ML1+0.07ML2

营业收入=0.97ML1+0.21ML2

流通股A =0.84ML1-0.06ML2

少数股东权益=0.48ML1+0.08ML2

净利润=0.96ML1+0.25ML2

经营活动的现金流量净额=-0.05ML1+1.00ML2

投资活动的现金流量净额=-0.03ML1-0.92ML2

筹资活动的现金流量净额=0.19ML1+0.29ML2

汇率变动对现金的影响=0.21ML1+0.22ML2

能够看出ML1主要对资产、负债、权益、利润有影响,ML2主要对经营活动、投资活动、筹资活动的现金流量有影响

称ML1为资产-负债-权益因子,ML2为现金流量因子

三、最后进行回归分析过程

用现有的財务变量探索上市银行股价与其主要財务指标的关系

lm<-lm(股价~.,data=data_bank)#用lm算它的线性回归
lm.aic<-step(lm,trace=FALSE)#用aic的检验法逐步回归
lm.bic<-step(lm,k=log(length(data_bank[,1])),trace=FALSE)#用bic的检验法逐步回归
##看两种方法逐步回归后的结果
summary(lm.aic)
summary(lm.bic)

Call:

lm(formula = 股价 ~ 股本 + 流通股A + 净利润, data = data_bank)

Residuals:

Min     1Q Median     3Q    Max

-4.442 -1.245  0.880  1.516  1.956

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept)  9.159659   0.796650  11.498 7.78e-08 ***

股本        -0.009116   0.002645  -3.447  0.00484 **

流通股A      0.002787   0.001570   1.774  0.10133

净利润       0.007820   0.002813   2.780  0.01665 *

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.195 on 12 degrees of freedom

Multiple R-squared: 0.7228,     Adjusted R-squared: 0.6536

F-statistic: 10.43 on 3 and 12 DF,  p-value: 0.00116

--------------------------------------------------------------------------------------------------------------

Call:

lm(formula = 股价 ~ 股本 + 流通股A + 净利润, data = data_bank)

Residuals:

Min     1Q Median     3Q    Max

-4.442 -1.245  0.880  1.516  1.956

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept)  9.159659   0.796650  11.498 7.78e-08 ***

股本        -0.009116   0.002645  -3.447  0.00484 **

流通股A      0.002787   0.001570   1.774  0.10133

净利润       0.007820   0.002813   2.780  0.01665 *

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.195 on 12 degrees of freedom

Multiple R-squared: 0.7228,     Adjusted R-squared: 0.6536

F-statistic: 10.43 on 3 and 12 DF,  p-value: 0.00116

通过AIC和BIC准则的检验,股本、流通股A、净利润对股价影响较大。为了保证线性模型的准确率,我们在检查这个模型是否存在多重共线性(自相关性),通过lmtest程序包中的dwtest函数对模型进行Durbin-Watson检验

library(lmtest)
dwtest(lm.aic) ## Durbin-Watson test ##data: lm.aic
##DW = 2.3843, p-value = 0.6526
##alternative hypothesis: true autocorrelation is greater than 0

DW检验仅仅适用于检验误差项是否存在一阶自相关情形。

DW检验过程例如以下。

给出如果

H0: r = 0   (ut 不存在一阶自相关)。

H1: r ¹ 0  (ut 存在一阶自相关)。

能够看出DW统计量为2.3843,p值为0.6526,说明模型不存在多重共线性(自相关性)

因此我们能够得到线性回归方程

股价=( 9159.659 -9.116*股本+ 2.787 *流通股A+ 7.820 *净利润)/1000。当中这三个变量的系数都在显著水平0.01水平下显著

分析结论

1. 通过对上市银行的相关財务数据进行因子分析,能够用两个公共主因子:资产负债权益因子ML1和现金流量因子ML2去影响股票价格72%的信息

2. 通过回归分析得出上市银行股价受股本、流通股、净利润三个变量的影响较大。

最新文章

  1. CSS 基本1
  2. ajax上传
  3. Android --#字XO小游戏
  4. Integer取值范围和NumberFormatException的解决
  5. ural 1109,NYOJ 239,匈牙利算法邻接表
  6. mysql数据库主从复制部署笔记
  7. PDA通过SocketTcp+Json和SuperSocket通信方式
  8. 常用的PC/SC接口函数
  9. js 截取某个字符前面或者后面的字符串
  10. R与数据分析旧笔记(⑦)回归诊断
  11. Jackson ObjectMapper类
  12. The Swift Programming Language-官方教程精译Swift(2)基础知识
  13. JavaScript es2015经验基础总结
  14. Redis登录密码设置
  15. nginx运用
  16. python简单实现tftp客户端(基于udp)
  17. Centos7使用docker搭建gitlab服务器
  18. phython安装
  19. normalized
  20. HDU-5001 Walk (概率DP)

热门文章

  1. C#异步编程(二)
  2. ASP.NET Session 详解
  3. wxPython入门练习代码 一
  4. 为IEnumerable扩展一个ForEach方法
  5. linux下的服务器搭建集成环境
  6. ThreadPoolExecutor的学习
  7. Asp.NET设置Session过期时间的四种方式
  8. 管理后台-第二部分:Custom sections in Umbraco 7 – Part 2 the views(翻译文档)
  9. mdf与ldf文件如何还原到SQLserver数据库
  10. Linux查看硬件信息,主板型号及内存硬件,驱动设备,查看设备,查看CPU。
  11. [Node.js] Exporting Modules in Node
  12. Java 第一个程序案HelloWorld例记录
  13. SSH反向连接及Autossh
  14. 深度理解DOM拷贝clone()
  15. bootstrap-table 列宽问题解决
  16. Coursera, Big Data 2, Modeling and Management Systems (week 1/2/3)
  17. Python的内置方法——补充
  18. Oracle创建表空间报错:O/S-Error: (OS 3) 系统找不到指定的路径
  19. delphi Timage 加上滚动条方法
  20. js等比压缩上传