怎样将paddlepaddleOCR的模型转换为pytorch模型

目的：将paddlepaddleocr的字符识别模型转换为pytorch的模型过程：mobilenetv3_small的小模型在转换过程中成功转换了backbone的参数，但是head（两个双向LSTM）转换失败，因为类别数不同，而LSTM中涉及到两个fc层两个lstm层，其中的fc层的参数和类别相关联，所以双向的LSTM参数无法进行转换；结果：只对backbone的参数进行了转换和拷贝原始pad

猫猫与橙子

7726人浏览 · 2020-08-15 11:12:27

猫猫与橙子 · 2020-08-15 11:12:27 发布

目的：将paddlepaddleocr的字符识别模型转换为pytorch的模型

过程：mobilenetv3_small的小模型在转换过程中成功转换了backbone的参数，但是head（两个双向LSTM）转换失败，因为类别数不同，而LSTM中涉及到两个fc层两个lstm层，其中的fc层的参数和类别相关联，所以双向的LSTM参数无法进行转换；

结果：只对backbone的参数进行了转换和拷贝

原始paddlepaddle工程链接：https://github.com/PaddlePaddle/PaddleOCR

简单叙述过程：

1）paddlepaddle的模型参数加载；

def _load_state(path):
    """
    记载paddlepaddle的参数
    :param path:
    :return:
    """
    if os.path.exists(path + '.pdopt'):
        # XXX another hack to ignore the optimizer state
        tmp = tempfile.mkdtemp()
        dst = os.path.join(tmp, os.path.basename(os.path.normpath(path)))
        shutil.copy(path + '.pdparams', dst + '.pdparams')
        state = fluid.io.load_program_state(dst)
        shutil.rmtree(tmp)
    else:
        state = fluid.io.load_program_state(path)
    return state

2）pytorch模型的构建；

3）进行参数拷贝和模型保存；

    def init_model(self):
        for n, m in self.net_pytorch.named_modules():
            if isinstance(m, BatchNorm2d):
                self.bn_init(n, m)
            elif isinstance(m, Conv2d):
                self.conv_init(n, m)
            # elif isinstance(m, Linear):
            #     self.fc_init(n, m)
            # elif isinstance(m, PReLU):
                # self.prelu_init(n, m)
            elif isinstance(m, BatchNorm1d):
                self.bn_init(n, m)

    def bn_init(self, layer , m):
        for key in self.list_layers:
            if (layer in key) and ('bn' in key):
                print(key) #, ' -- shape: ', self.state_pp[key].shape)
                if 'scale' in key:
                    m.weight.data.copy_(torch.FloatTensor(self.state_pp[key]))
                    self.list_layers.remove(key)
                elif 'offset' in key:
                    m.bias.data.copy_(torch.FloatTensor(self.state_pp[key]))
                    self.list_layers.remove(key)
                elif 'mean' in key:
                    m.running_mean.copy_(torch.FloatTensor(self.state_pp[key]))
                    self.list_layers.remove(key)
                elif 'variance' in key:
                    m.running_var.copy_(torch.FloatTensor(self.state_pp[key]))
                    self.list_layers.remove(key)


    def conv_init(self, layer, m):
        # for pr in net.params:
        layer_ = layer+'_'
        for key in self.list_layers:
            if (layer_ in key) and ('bn' not in key):
                print(key) #, ' -- shape: ', self.state_pp[key].shape)
                if 'weights' in key:
                    m.weight.data.copy_(torch.FloatTensor(self.state_pp[key]))
                elif 'offset' in key:
                    m.bias.data.copy_(self.state_pp[key])
                self.list_layers.remove(key)

技术难点：

1）paddlepaddle中怎样读取每层的输出参数；

2）双向LSTM的参数拷贝；

3）验证参数转换是否成功时，读取图片传入后，每层layer处理后的图片特征；

工程链接：https://github.com/maomaoyuchengzi/paddlepaddle_param_to_pyotrch

开放原子开发者工作坊

开放原子开发者工作坊旨在鼓励更多人参与开源活动，与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动，如meetup、训练营等，主打技术交流，干货满满，真诚地邀请各位开发者共同参与！

更多推荐

第二届openEuler生态大会（中国·湖南）成功举办

10月30日，第二届openEuler生态大会（中国·湖南）成功举办。

开放原子开发者工作坊

“小满”安全车控操作系统正式在AtomGit开源

10月24日，由中国汽车工业协会指导，普华基础软件股份有限公司主办的“小满”安全车控操作系统开源发布会暨共建计划说明会成功举行。普华基础软件宣布将安全车控操作系统“小满”（简称“小满”）V24.10源代码正式在开放原子开源基金会（简称“基金会”）旗下AtomGit开源协作平台开源，并在AtomGit平