关于project的idea,我认为可以做一个关于论文的reference提取的软件。
1) N (Need 需求)
我们在用latex写论文时,如果想要引用一篇论文,那么首先需要拿到它作为reference的bib文件形式。目前该领域主要做法有利用google scholar提供bibtex下载的功能,或者利用IEEE,ACM数据库提供的某些文章的bibtex信息,另外endnote之类的文献管理软件通过相关数据库的绑定等操作也能获取引用某文章时所需要的reference。但是我认为关于这一领域还是有很大的可以进步的空间的。现在的方法获取的信息的准确性和完整性依然不能保证。。
2) A (Approach 做法)
我们的想法是说如果我们能从引用这篇文章的pdf中直接获取相关的reference信息并以正确的格式写在latex所需的bib文件里面,那么在假设已有论文的reference格式准确,信息完整的前提下,这种获取bib文件的方法的准确性将得到保证。事实上,我们写文章需要引用的文章基本上会来自一个领域,这些文章的部分很有可能会同时在另外一篇文章被引用过。那么我们依照它将可以同时获得多篇文章的引用方法和格式。这个软件的主要任务是pdf文件reference部分准确的信息提取功能。
3) B (Benefit 好处)
高准确率。
4) C (Competitors 竞争)
Endnote 之类的文献管理软件和 google scholar的直接搜索到的bibtex文件。