megvii
calcium_oxide Lv3

Megvii实习

一些常用工具

  1. 公司邮箱
1
caohongliang@megvii.com
  1. 内部账户用户名与初始密码
1
caohongliang
1
ih3k9z*9gn6
  1. 旷视门户
1
https://myhome.megvii-inc.com/#/home
  1. 工作空间
1
ssh -CAXY test.caohongliang.megvii-face.ws@hh-d.brainpp.cn
  1. 关于brain++的问题发帖
1
https://discourse.brainpp.cn/c/support/brain-20-support/109
  1. seminar机制
1
https://wiki.megvii-inc.com/pages/viewpage.action?pageId=394820897
  1. git
1
https://git-core.megvii-inc.com/
  1. 工单系统
1
https://muop.megvii-inc.com/ticket/list
  1. brain++
1
https://hh-d.brainpp.cn/kubebrain/megvii-face/workspace/index?lang=zh_CN
  1. 新人入职
1
https://wiki.megvii-inc.com/pages/viewpage.action?pageId=320093387
  1. 论坛
1
https://fr-discourse.megvii-inc.com/
  1. Megengine文档
1
https://megengine.megvii-inc.com/
  1. markdown在线文档
1
https://codimd.mcd.megvii-inc.com/
  1. 实习生日报
1
https://fr-discourse.megvii-inc.com/c/research/85-category/85
  1. OSS相关
1
https://discourse.brainpp.cn/t/topic/848
1
https://www.brainpp.cn/account/security
1
https://docs.aws.amazon.com/cli/latest/userguide/cli-usage-output.html
1
https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3.html
1
https://www.brainpp.cn/wh-a/console/storage?type=oss
  1. 申请GPU资源
1
https://discourse.brainpp.cn/t/topic/60162
  1. snapdet相关
1
http://faceteam.pages-git-core.megvii-inc.com/snapx/snapdet/cmd.html
1
https://git-core.megvii-inc.com/FaceTeam/snapx/snapdet

snapdet文档

  1. basedet相关
1
https://git-core.megvii-inc.com/base-detection/basedet/-/tree/master
  1. sds数据格式文档
1
https://git-core.megvii-inc.com/FaceTeam/snapx/snapclf/-/blob/release/v0.2.3/docs/sds_format.md
1
https://git-core.megvii-inc.com/FaceTeam/snapx/snapdet/-/blob/release/v0.9.3/docs/own-data.md
  1. ais
1
https://ais.brainpp.cn/ais/megvii/AIS-AIT/automaticLearning/
  1. tmux
1
https://www.ruanyifeng.com/blog/2019/10/tmux.html
  1. nori文档
1
https://discourse.brainpp.cn/t/topic/842
  1. wiki个人空间
1
https://wiki.megvii-inc.com/spaces/viewspace.action?key=~caohongliang
  1. 批量删除进程
1
ps -ef | grep google | awk '{print $2}' | xargs kill -9
  1. megengine开源文档
1
https://www.megengine.org.cn/doc/1.11/zh/reference/api/megengine.data.DataLoader.html#megengine.data.DataLoader

​ 内部文档

1
https://megengine.megvii-inc.com/user-guide/install/index-internal.html
  1. 保存本地修改文件并拉去更新远程最新分支
1
2
3
git stash
git pull origin master
git stash pop
  1. 预训练模型权重
1
https://fr-discourse.megvii-inc.com/t/topic/12860/41
  1. 检测模型矩阵
1
https://fr-discourse.megvii-inc.com/t/topic/12860/53
  1. dpflow
1
https://discourse.brainpp.cn/t/topic/843
  1. ads
1
http://brain-sdk.pages-git-core.megvii-inc.com/ads/
  1. basedet环境配置
1
2
3
4
5
6
7
8
9
10
1. 配置megbrain环境
pip3 install megbrain==8.16.0+cu111(版本根据要求选择)(cuda根据要求选择)
2. 配置basedet环境
git clone git@git-core.megvii-inc.com:base-detection/basedet.git
cd basedet
python3 -m pip install -r requirements.txt
python3 -m pip install pre-commit
pre-commit install
python3 -m pip install -v -e .
3. 如果出现跑不了的问题,大概率是megbrain版本不匹配
  1. info格式数据处理
1
https://livelove.megvii-inc.com/t/topic/4274

np4数据处理

1
https://discourse.brainpp.cn/t/topic/3877
  1. axion-torch文档
1
https://discourse.brainpp.cn/t/topic/38814
  1. ads
1
https://discourse.brainpp.cn/c/support/ads/131

入职安排

实习日志

2022.11.01:

入职,配置VPN

2022.11.02:

配置了brain++环境,解决了本地ssh的问题,安装了megbrain、megskull、meghair

2022.11.03:

邮寄协议

处理对象存储OSS

配置OSS

配置basedet和snapdet环境

建数据bucket

测试一下snapdet环境

2022.11.04:

算法量产

开发模型,提供算法模型

AIT

给出比较成熟的solution

basenet方便实验

snapdet基于basenet,快速的启动一个服务

提一些新的solution,和之前进行对标

四套数据,旧的和新的solution实验并整理结果

rlaunch

AIS

nori

nori加速

每周三组会、日报周报

暂时想到的一些方案:

抽取出r通道的值,对0-255进行像素点的个数计算,去像素值阈值选取相应的区间

2022.11.07:

检测框去除方案:

1
https://codimd.mcd.megvii-inc.com/ZU8RPqVQRtmznLR6DxJRgw

2022.11.08:

  • 论文paper reading
  • snapdet问题看一下
  • 数据看一下情况

2022.11.09:

  • 搞一下数据集
  • 搞一下检测方案

2022.11.10:

  • 数据集
  • 检测方案

2022.11.11:

  • 再测试一下检测方案

2022.11.12-2022.11.16:

考试复习

2022.11.17:

  • 去除检测框再完善一下,尝试一下新的方案
  • 整理一下去除检测框的文档
  • 人体检测实验中间结果测试一下

2022.11.18:

2022.11.19:

  • 检测框实验

2022.11.21:

  • 看一下新的任务具体情况

2022.11.22:

  • 看一下T41芯片适配问题

2022.11.29:

  • 比较一下人脸检测的三个proposal结果(十一点半)
  • 人脸检测pointhead修改拉个分支提交一下(十一点半之前)
  • 猫狗检测跑上实验(十二点)

2022.11.30:

  • 人脸实验结果汇总
  • 宠物实验结果跑完

2022.12.06:

  • data.yaml的问题
  • 转换后的数据集不是data.yaml中的全部?
  • config文件里面backbone是哪个?

2022.12.08:

  • 扩展实验跑上

2022.12.11:

总结一下过去一段时间做的实验:

  1. 检测框去除

  2. 人体检测

  • 扩展数据集在人体数据集上的实验(100epoch)
  1. 人脸检测
  • 在resnet130M上跑了两个proposal+baseline
  • 在resnet100M上跑了两个proposal+baseline
  • 扩展数据集上实验(100epoch)
  1. 宠物检测
  • 在resnet130M上跑了两个proposal
  • 在resnet100M上跑了两个proposal
  • 生成proposal2的tracedmodule(用于模型手术)
  • 在resnet100M上的proposal2宠物检测在七个BMK上的实验对比

2022.12.13:

  • 人脸的config传上分支
  • 人体的换一个resnet260M跑一个实验看一下结果,data.yaml原数据去掉

2022.12.16:

  • 宠物100M models中head的numsconv置为0,看一下效果
  • 人体比较security

2022.12.27:

  • 宠物换repvgg 110M跑一个实验
  • 人体人脸上传git
  • 人体人脸生成tracemodule

目前在跑的实验:

  1. test1:宠物100M models中head的numsconv置为0(没训起来)重新把两个subnet去掉再跑一遍实验,效果不好(空闲)(占着六张卡),宠物暂时放一放(空闲)|人体训练数据将不符合条件的FP和无人体的数据去掉,跑一个resnet260M/proposal1/epoch100的实验(效果还可以,还是在权重0.3的情况下),跑了一个resnet130M/proposal1/epoch100人脸实验(训崩了)(空闲)
  2. test3:human resnet260M/proposal1/epoch300看一下延长训练时长是否有效(有效果,提升三个点左右),提高FP权重(降低误检率)跑一下epoch100的结果对比一下(效果不错),继续提高FP的权重,提高到0.2跑一下epoch100实验(还有提升空间),提高了0.3再跑了一个实验(效果差了很多),筛掉不符合条件的数据后将FP权重调到0.2重新跑了一遍实验(效果没有提升),epoch提升到300跑一个实验(略有提升),跑一个repvgg160M看一下效果(差10个点左右)(空闲)
  3. test4:face resnet260M/proposal1/epoch100(去掉所有FP)(跑完效果不错)延长训练时长(300)再跑一遍,check一下FP数据(筛选出一批符合人脸实验的FP),跑了一个resnet130M/proposal1/epoch100的人体实验(掉点很多)(空闲)
  4. test5:face resnet130M/proposal1/epoch100(去掉所有FP)(跑完效果不行)延长训练时长(300)再跑一遍,看一下实验结果(结果不行,没学到东西)(空闲),跑一个加上筛选后的FP的resnet260M/proposal1/epoch100实验(效果也很好),提高一下FP权重跑一下实验(效果下降),跑了300epoch的加原权重的FP数据(效果下降),看了一下中间结果大概在200epoch的时候效果最好,(测试了一下中间200epoch时的结果还是比100轮降低了一些)将epoch调整为200在跑了一个实验(效果略有提升)(空闲)跑了宠物/proposal1/repvgg110M(低了30个点),修改了一下模型又跑一个实验(效果更差),human的FP降到最原始权重跑一个实验(效果更差)(空闲)
  5. test2:空闲

2023.01.09:

  • 地面分割标定
  • 人体分割

地面分割交接文档

1
https://wiki.megvii-inc.com/pages/viewpage.action?pageId=432392175

地面分割标定需求

1
https://wiki.megvii-inc.com/pages/viewpage.action?pageId=380577782

人体分割交接文档

1
https://wiki.megvii-inc.com/pages/viewpage.action?pageId=432392150

人体分割需求

1
https://wiki.megvii-inc.com/pages/viewpage.action?pageId=396386879

地面分割&人体分割现状

1
https://wiki.megvii-inc.com/pages/viewpage.action?pageId=432390147

worker情况

test1(8) test2(6) test3(8) test4(0) test5(8)
地面分割实验 人体分割数据dpflow 人体分割实验 地面分割数据dpflow 空闲
地面分割finetune 空闲 空闲 地面分割供数据
地面分割int4->float32 地面分割供数据

2023.01.15:

人体分割流程走完,点也对上了,有几个问题:

  • 对分是什么意思(模型ads前后的输出相似度对比、模型和板上的指标对比)
  • 需要适配的平台有哪些
  • 适配前和适配后的分割指标看哪个
  • 除了分割指标外还要看哪些指标,重点是哪些(miu、miubd)
  • 计算量和参数量
  • 板上推理时间怎么计算(专门的工具计算)

2023.02.06:

baseseg相关参考文档:

关键点检测论文梳理

basekps

kps数据集汇总

mmseg

  • Post title:megvii
  • Post author:calcium_oxide
  • Create time:2022-11-01 21:14:06
  • Post link:https://yhg1010.github.io/2022/11/01/megvii/
  • Copyright Notice:All articles in this blog are licensed under BY-NC-SA unless stating additionally.