Suisuisuisui-sui / LibraryBigData

Python和R语言应用案例,提供1年的图书馆借阅数据,并进行大数据分析。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

图书馆大数据分析


图书馆大数据分析初始阶段是针对华中科技大学出版社的教材《Python语言程序设计基础》和《R语言程序设计基础》设计的应用案例,项目的目标是收集更多的图书馆大数据分析开源的数据集、需求和实现样本,为开展大数据技术的学习、研究提供实例,也鼓励将本项目的资源应用到实际的图书馆大数据分析。
随着数字化图书馆的运行,图书馆积累了大量的读者借阅书籍、检索文献的数据。随着大数据技术的发展,人们开始关注如何利用这些数据为读者提供更加高级、周到的服务。
在大数据环境下,图书馆及其服务也必将产生新的巨大变化,深层次的服务功能可以通过大数据技术的运用加以实现。主要体现在两个方面:
(1)提供以人为本的个性化服务。在大数据的支持下,髙细腻的个性化服务能够得到更加有效的开展。图书馆可以基于不同个体的个性特点、性格偏好提供定制式的个体服务,如个性化图书推荐。也可根据热门书籍的分析,为图书馆够提供参考信息。通过对读者整体关注的分析,为学校在在课程、教学方面提供参考信息。
(2)图书馆服务的内容将发生变化。传统的图书馆服务提供的是以文献或书籍为图书资源单元的服务,不对资源内容进行进一步处理。大数据环境下,开始向知识服务方向发展。知识服务的内容通过文本挖掘、大数据技术等,从图书资源中分析出更加细致的知识单元,并通过知识单元挖掘图书资源间的内在关系,提供高附加值的信息分析、决策咨询领域、知识问答等高级服务。
仅针对个性化服务方面,列出部分基本的图书馆大数据分析需求:
1.最热门的图书有哪些
这是一个学生、老师、图书馆都关心的问题。学生关心“我应用学习什么”,学校关心“学生们的兴趣是什么”,图书馆关系“哪些书最受欢迎”,都可以从这个问题中得到答案。
更深入地,这个问题还可从不同角度进行分析,包括:

  • 全校最热门书
  • 某专业最热门书
  • 各年级最热门的书
  • 最流行的小说
  • 考研最好的数学书
更广泛地,这个问题还可与其它数据结合起来进行分析。如与课表相结合,可以分析:
  • 学生借阅与上课相关的图书有哪些?
  • 借阅与上课无关的图书有哪些?
  • 哪些老师上课会引起同学们读书兴趣?
  • 最流行的小说
  • 考研最好的数学书
与科研管理信息结合,可以分析: 更广泛地,这个问题还可与其它数据结合起来进行分析。如与课表相结合,可以分析:
  • 哪些图书对科学研究有帮助?
  • 哪些书对研究生研究方向有关?
  • 哪些老师上课会引起同学们读书兴趣?
  • 最流行的小说
  • 考研最好的数学书
结合多年的数据,还可以分析**近年来热门图书变化趋势是怎样的?**

(2)哪些图书需要增加馆藏量?
受成本限制和使用效率的考虑,图书馆每本书采购量是有限的。如何精准把握图书馆藏量是一个很难的问题。书买多了,借得人少,会造成资源浪费;书买少了,不够借,满足不了读者需要。根据图书借阅趋势分析,可辅助图书馆科学合理地进行图书采购。
(3)如何推荐读者可能感兴趣的书籍
这是一个非常有趣的问题,在广告营销、网站搜索等经常会遇到类似的现象。根据图书借阅历史数据,可以分析出不同专业、不同课程的热门书箱,结合读者的专业,可以作出推荐。当读者给出检索词后,可以向读者推荐有经验的老师会借哪些书。当读者择定要借的书后,可以进一步推荐借过此书的人还借过哪些书。
作为课程案例,仅针对第1个需求中的“全校最热门书”这一问题进行分析。有兴趣的读者可以进一步对其它问题进行分析。

About

Python和R语言应用案例,提供1年的图书馆借阅数据,并进行大数据分析。


Languages

Language:R 51.4%Language:Python 48.6%