Megvii实习
一些常用工具
- 公司邮箱
- 内部账户用户名与初始密码
- 旷视门户
1
| https://myhome.megvii-inc.com/
|
- 工作空间
1
| ssh -CAXY test.caohongliang.megvii-face.ws@hh-d.brainpp.cn
|
- 关于brain++的问题发帖
1
| https://discourse.brainpp.cn/c/support/brain-20-support/109
|
- seminar机制
1
| https://wiki.megvii-inc.com/pages/viewpage.action?pageId=394820897
|
- git
1
| https://git-core.megvii-inc.com/
|
- 工单系统
1
| https://muop.megvii-inc.com/ticket/list
|
- brain++
1
| https://hh-d.brainpp.cn/kubebrain/megvii-face/workspace/index?lang=zh_CN
|
- 新人入职
1
| https://wiki.megvii-inc.com/pages/viewpage.action?pageId=320093387
|
- 论坛
1
| https://fr-discourse.megvii-inc.com/
|
- Megengine文档
1
| https://megengine.megvii-inc.com/
|
- markdown在线文档
1
| https://codimd.mcd.megvii-inc.com/
|
- 实习生日报
1
| https://fr-discourse.megvii-inc.com/c/research/85-category/85
|
- OSS相关
1
| https://discourse.brainpp.cn/t/topic/848
|
1
| https://www.brainpp.cn/account/security
|
1
| https://docs.aws.amazon.com/cli/latest/userguide/cli-usage-output.html
|
1
| https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3.html
|
1
| https://www.brainpp.cn/wh-a/console/storage?type=oss
|
- 申请GPU资源
1
| https://discourse.brainpp.cn/t/topic/60162
|
- snapdet相关
1
| http://faceteam.pages-git-core.megvii-inc.com/snapx/snapdet/cmd.html
|
1
| https://git-core.megvii-inc.com/FaceTeam/snapx/snapdet
|
snapdet文档
- basedet相关
1
| https://git-core.megvii-inc.com/base-detection/basedet/-/tree/master
|
- sds数据格式文档
1
| https://git-core.megvii-inc.com/FaceTeam/snapx/snapclf/-/blob/release/v0.2.3/docs/sds_format.md
|
1
| https://git-core.megvii-inc.com/FaceTeam/snapx/snapdet/-/blob/release/v0.9.3/docs/own-data.md
|
- ais
1
| https://ais.brainpp.cn/ais/megvii/AIS-AIT/automaticLearning/
|
- tmux
1
| https://www.ruanyifeng.com/blog/2019/10/tmux.html
|
- nori文档
1
| https://discourse.brainpp.cn/t/topic/842
|
- wiki个人空间
1
| https://wiki.megvii-inc.com/spaces/viewspace.action?key=~caohongliang
|
- 批量删除进程
1
| ps -ef | grep google | awk '{print $2}' | xargs kill -9
|
- megengine开源文档
1
| https://www.megengine.org.cn/doc/1.11/zh/reference/api/megengine.data.DataLoader.html
|
内部文档
1
| https://megengine.megvii-inc.com/user-guide/install/index-internal.html
|
- 保存本地修改文件并拉去更新远程最新分支
1 2 3
| git stash git pull origin master git stash pop
|
- 预训练模型权重
1
| https://fr-discourse.megvii-inc.com/t/topic/12860/41
|
- 检测模型矩阵
1
| https://fr-discourse.megvii-inc.com/t/topic/12860/53
|
- dpflow
1
| https://discourse.brainpp.cn/t/topic/843
|
- ads
1
| http://brain-sdk.pages-git-core.megvii-inc.com/ads/
|
- basedet环境配置
1 2 3 4 5 6 7 8 9 10
| 1. 配置megbrain环境 pip3 install megbrain==8.16.0+cu111(版本根据要求选择)(cuda根据要求选择) 2. 配置basedet环境 git clone git@git-core.megvii-inc.com:base-detection/basedet.git cd basedet python3 -m pip install -r requirements.txt python3 -m pip install pre-commit pre-commit install python3 -m pip install -v -e . 3. 如果出现跑不了的问题,大概率是megbrain版本不匹配
|
- info格式数据处理
1
| https://livelove.megvii-inc.com/t/topic/4274
|
np4数据处理
1
| https://discourse.brainpp.cn/t/topic/3877
|
- axion-torch文档
1
| https://discourse.brainpp.cn/t/topic/38814
|
- ads
1
| https://discourse.brainpp.cn/c/support/ads/131
|
入职安排
入职上手
-
hh-d workspace环境配置
实习日志
2022.11.01:
入职,配置VPN
2022.11.02:
配置了brain++环境,解决了本地ssh的问题,安装了megbrain、megskull、meghair
2022.11.03:
邮寄协议
处理对象存储OSS
配置OSS
配置basedet和snapdet环境
建数据bucket
测试一下snapdet环境
2022.11.04:
算法量产
开发模型,提供算法模型
AIT
给出比较成熟的solution
basenet方便实验
snapdet基于basenet,快速的启动一个服务
提一些新的solution,和之前进行对标
四套数据,旧的和新的solution实验并整理结果
rlaunch
AIS
nori
nori加速
每周三组会、日报周报
暂时想到的一些方案:
抽取出r通道的值,对0-255进行像素点的个数计算,去像素值阈值选取相应的区间
2022.11.07:
检测框去除方案:
1
| https://codimd.mcd.megvii-inc.com/ZU8RPqVQRtmznLR6DxJRgw
|
2022.11.08:
2022.11.09:
2022.11.10:
2022.11.11:
2022.11.12-2022.11.16:
考试复习
2022.11.17:
2022.11.18:
2022.11.19:
2022.11.21:
2022.11.22:
2022.11.29:
2022.11.30:
2022.12.06:
2022.12.08:
2022.12.11:
总结一下过去一段时间做的实验:
检测框去除
人体检测
- 人脸检测
- 宠物检测
2022.12.13:
2022.12.16:
2022.12.27:
目前在跑的实验:
- test1:宠物100M models中head的numsconv置为0(没训起来)重新把两个subnet去掉再跑一遍实验,效果不好(空闲)(占着六张卡),宠物暂时放一放(空闲)|人体训练数据将不符合条件的FP和无人体的数据去掉,跑一个resnet260M/proposal1/epoch100的实验(效果还可以,还是在权重0.3的情况下),跑了一个resnet130M/proposal1/epoch100人脸实验(训崩了)(空闲)
- test3:human resnet260M/proposal1/epoch300看一下延长训练时长是否有效(有效果,提升三个点左右),提高FP权重(降低误检率)跑一下epoch100的结果对比一下(效果不错),继续提高FP的权重,提高到0.2跑一下epoch100实验(还有提升空间),提高了0.3再跑了一个实验(效果差了很多),筛掉不符合条件的数据后将FP权重调到0.2重新跑了一遍实验(效果没有提升),epoch提升到300跑一个实验(略有提升),跑一个repvgg160M看一下效果(差10个点左右)(空闲)
- test4:face resnet260M/proposal1/epoch100(去掉所有FP)(跑完效果不错)延长训练时长(300)再跑一遍,check一下FP数据(筛选出一批符合人脸实验的FP),跑了一个resnet130M/proposal1/epoch100的人体实验(掉点很多)(空闲)
- test5:face resnet130M/proposal1/epoch100(去掉所有FP)(跑完效果不行)延长训练时长(300)再跑一遍,看一下实验结果(结果不行,没学到东西)(空闲),跑一个加上筛选后的FP的resnet260M/proposal1/epoch100实验(效果也很好),提高一下FP权重跑一下实验(效果下降),跑了300epoch的加原权重的FP数据(效果下降),看了一下中间结果大概在200epoch的时候效果最好,(测试了一下中间200epoch时的结果还是比100轮降低了一些)将epoch调整为200在跑了一个实验(效果略有提升)(空闲)跑了宠物/proposal1/repvgg110M(低了30个点),修改了一下模型又跑一个实验(效果更差),human的FP降到最原始权重跑一个实验(效果更差)(空闲)
- test2:空闲
2023.01.09:
地面分割交接文档
1
| https://wiki.megvii-inc.com/pages/viewpage.action?pageId=432392175
|
地面分割标定需求
1
| https://wiki.megvii-inc.com/pages/viewpage.action?pageId=380577782
|
人体分割交接文档
1
| https://wiki.megvii-inc.com/pages/viewpage.action?pageId=432392150
|
人体分割需求
1
| https://wiki.megvii-inc.com/pages/viewpage.action?pageId=396386879
|
地面分割&人体分割现状
1
| https://wiki.megvii-inc.com/pages/viewpage.action?pageId=432390147
|
worker情况
test1(8) |
test2(6) |
test3(8) |
test4(0) |
test5(8) |
地面分割实验 |
人体分割数据dpflow |
人体分割实验 |
地面分割数据dpflow |
空闲 |
地面分割finetune |
空闲 |
空闲 |
地面分割供数据 |
|
地面分割int4->float32 |
|
|
地面分割供数据 |
|
2023.01.15:
人体分割流程走完,点也对上了,有几个问题:
2023.02.06:
baseseg相关参考文档:
关键点检测论文梳理
basekps
kps数据集汇总
mmseg