博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
logistic regression的一些问题,不平衡数据,时间序列,求解惑
阅读量:6979 次
发布时间:2019-06-27

本文共 1459 字,大约阅读时间需要 4 分钟。

Logistic Regression

1、在有时间序列的特征数据中,怎么运用LR?

不光是LR,其他的模型也是。

有很多基本的模型变形之后,变成带时序的模型。但,个人觉得,这类模型大多不靠谱。

我觉得还是要从业务出发,同时探测分析数据,得出比较合理的假设,然后提取特征,这些特征可以含有时间信息,但不一定是时序的。比如,前N天其他特征的统计组合等。

 

可以参考:

Q:  I would like to use a binary logistic regression model in the context of streaming data (multidimensional time series) in order to predict the value of the dependent variable of the data (i.e. row) that just arrived, given the past observations. As far as I know, logistic regression is traditionally used for postmortem analysis, where each dependent variable has already been set (either by inspection, or by the nature of the study).

A:  There are two methods to consider:

  • Only use the last N input samples. Assuming your input signal is of dimension D, then you have N*D samples per ground truth label. This way you can train using any classifier you like, including logistic regression. This way, each output is considered independent from all other outputs.

  • Use the last N input samples and the last N outputs you have generated. The problem is then similar to . You could generate a non-binary score based on the input samples, and combine the score of multiple samples using a viterbi decoder. This is better than method 1. if you now something about the temporal relation between the outputs.

 

2、数据不平衡时怎么处理?

比如正负比例1:100,而要研究的是正例的1,这时候LR表现非常差。

一般有两种方案:

1)调整权重,比如正例*10。ps,个人实验还是不理想

2)sample,还没尝试

 

参考: 正反例极不平衡的数据集的采样

 

转载于:https://www.cnblogs.com/549294286/p/3644076.html

你可能感兴趣的文章
开放产品开发(OPD):Archi 汉化工具下载
查看>>
VS code for python开发利器
查看>>
高性能的MySQL(1)锁和MVCC
查看>>
如何用VDP备份虚拟机
查看>>
虚拟机安装 Windows 10 9926 预览版 “准备就绪”...... 故障
查看>>
FTP服务器的防火墙通用设置规则
查看>>
遍历系统文本全文
查看>>
《人人都能看懂经济学》读书笔记
查看>>
Linux文本比较命令:diff
查看>>
Android开发实践:JNI函数签名生成器
查看>>
危机!测试工程师真的要小心了
查看>>
MySQL 高可用MMM
查看>>
Centos6.2_X86_64 _LNMP安装全程实录
查看>>
我的友情链接
查看>>
eclipse插件安装方法
查看>>
Android帧缓冲区(Frame Buffer)硬件抽象层(HAL)模块Gralloc的实现原理分析(1)...
查看>>
Javascript中的字符串链接和Array.join()方法时间效率对比
查看>>
内部毕业学生对老男孩教育的客观评价
查看>>
SQL Server 表和索引存储结构
查看>>
Linux监控之系统性能
查看>>