只用REAPER英文版需要掌握多少英语词汇?

How many English words do you need to know in using REAPER?

Posted by Tee on December 20,2019

最近网上有蛮多新朋友了解到REAPER这一款软件,他们最常问的便是“有没有汉化包/中文版”,也对一些REAPER老手建议使用英文版表示不理解。这里不再讨论使用REAPER使用英文版还是汉化包,先用数据证明只用REAPER英文需要掌握多少英语词汇?是不是真的像一些朋友说的那么难。

本文数据采用的是template_reaper60rc1.ReaperLangPack语言包模板文件。REAPER官方明确表示语言包的事情交给社区,而这个正是官方释出用来制作语言包模板文件。这个模板文件包含大部分REAPER中会出现的文字、句子,能够代表REAPER的原版词汇。

词汇量有多少

在经过分词、清除符号、去掉停用词、去重等一些步骤后,我们得到了最终的词汇量是:3569。

根据2019广东高考英语科听说考试的大纲,词汇量要求正是3500个,跟REAPER的原版词汇量几乎一样。如果你经历过高考,或准备参与高考,那很可能你的词汇量已经足够了。

这个只是最高要求

2019广东高考听力科要求词汇量

掌握不了怎么办

如果你的英语像我那样比较菜,先别被3600这个数字吓到,听我一步步分析。

在使用REAPER时,英语起到关键作用的地方无非就是action list。在action list只要拼写顺序正确,输入残缺的句子,不管语法也能搜索出来;而常用常见的单词绝不是3600这么多。

接着看下去你就会了解。

哪些单词最常用

因为下面用到,在这里先科普一下叫tf-idf统计方法。

引用维基百科的解释:tf-idf(英语:term frequency–inverse document frequency)是一种用于信息检索与文本挖掘的常用加权技术。tf-idf是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。tf-idf加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。

一句话的解释是:tf-idf数值越高,这个词越重要。

 

我对这里面3500个最常见的单词做了统计,并排列出200个tf-idf数值最高的单词。这些单词是REAPER里出现得最多最常见的。你可以在以下链接在线浏览完整表格:https://docs.qq.com/sheet/DS3RpenR0VEVKSW1O?c=D4A0A0

REAPER语言包tf-idf词汇

列名的含义是:

  • word:词汇
  • count:出现次数
  • showscount:词汇出现过在多少个句子中
  • idf:逆向文件频率
  • tf-idf:确定词语重要性的数值
  • ratio:词语出现过的句子占总体比例

 

可以看到前10个单词在REAPER的文字中出现频率真的很高,可能也是大部分人经常接触的功能。

  1. item,一切的开端
  2. track,也是一切的开端
  3. set,可能在action list里输入最多的词
  4. select,Cubase用户刚用REAPER想导出时一定会碰到的
  5. midi,除非你不做midi
  6. edit,这个我个人比较少输入在action list
  7. note,除非你不做midi
  8. project,更是一切的开端
  9. envelope,一切都是envelope
  10. time,time

 

以上10个单词你都知道什么含义,那恭喜你,REAPER中66.9%的句子都可能会出现你认识的词汇!

3600个单词中掌握10个,就能在超过半数的句子里看到认识的单词。

如果这也叫做难,那世上无难事,只怕有心人。

这仅仅是开始

当然这仅仅是开始,你还要掌握更多的词汇,才能完整的搜索到一个句子。

从我统计的那份表格开始吧(https://docs.qq.com/sheet/DS3RpenR0VEVKSW1O?c=D4A0A0),先从10个开始,结合自己的需求,就会越来越熟练的。

我最常用的单词,不超过50个;我能看懂的单词,也不超过500个。但在REAPER里,已经是完全够用的。

局限性

这份表格有它的局限性。由于采用的是语言包模板,有些比较重要的名词可能在权重较低的位置,如transport(走带)。结合自己的需求才是最佳的。

祝顺利。


本作品采用知识共享署名 4.0 国际许可协议进行许可。