如何计算高维回归统计

我下面有一个模特

A = matrix(1, nrow = 400, ncol = 400)
A = 2**abs(row(A) - col(A))
X=mvtnorm::rmvnorm(300,mean=rep(0,400),sigma=A)))  
Y=X[,6]+X[,12]+X[,15]+X[,20]+0.7*pnorm(X[,1])*rnorm(300) 
df <- data.frame(Y, X)

我想为其拟合最小二乘法。我需要总结以下内容:

  1. 模拟运行中包括X6,X12,X15和X20的时间百分比
  2. 选择模拟运行的比例X1。

我的代码如下,但我无法获得正确的数字:

lmb<- 10^seq(-3, 5, length.out = 100) # Perform 10-fold cross-validation to select lambda 
lassocv <- glmnet::cv.glmnet(X, Y, alpha = 1, lambda = lmb,standardize = TRUE, nfolds = 10)
lambdacv <- lassocv$lambda.min
modelcv <- glmnet::glmnet(X, Y, alpha = 1, lambda = lambdacv, standardize = TRUE)
bhat = predict(output,type="coefficients",s=lambdacv)[1:length(output$beta),]

我如何计算1.和2.?结果应为100%和6%。

*还有一个额外的问题,如果我想计算由sum(abs(beta-betahat))定义的绝对估计误差,beta是什么?我知道bettahat来自上述预测。为此,我应该得到1.37。