Skip to content

FAQ | 可能会问到的问题

Yuukiy edited this page Nov 30, 2023 · 19 revisions

支持抓取哪些网站的数据?

目前已经实现了对以下站点的支持:

站点 站点数据特点
airav 有中文影片标题
avsox
avwiki 能够从这个站点获得所谓“素人”、“企划”类影片的实际女优名,例如259LUXU系列
fanza FANZA市场一手数据源。影片下架的话就搜不到了
fc2 FC2市场一手数据源。影片下架的话就搜不到了
fc2fan 站点已经关闭,此前有热心用户提供了镜像站,不过也已经关闭。现在要使用它的话需要你在本地有备份的站点数据
javbus
javdb 数据维护得很全,参与影片评分的人也多,不过FC2要网站VIP才能访问,另外就是部分女优名展示的不是常用名
javlib
javmenu 站点数据质量很差,还在影片标题里插广告,完全可以不启用它(虽然软件会尝试去广告)
jav321
msin 能抓取FC2下架影片(不过下架的影片没有封面)
mgstage MGS市场一手数据源。影片下架的话就搜不到了
prestige PRESTIGE市场一手数据源。影片下架的话就搜不到了

如果你希望添加对某个站点的支持,提issue时需要说明这个站点的特点,例如举例说明哪些影片数据是现有站点难以支持的,例如这个范例就很好

设置抓取到的中文信息与日文信息的优先级

默认配置文件会优先使用中文标题(如果能够获取到中文信息的话),将title__chinese_first设置为no则会优先使用日文标题,但是如果所有日文站点的均无法抓取到数据,还是会采用中文站点的数据。

如果希望在任何情况下都不使用中文标题,请去除下面爬虫列表中的airav

normal = airav,avsox,javbus,javdb,javlib,jav321,mgstage,prestige

怎么为不同的文件夹设置不同的整理规则?

将你需要的的规则保存为多个不同的配置文件,然后用命令指定配置文件,例如JavSP -c D:\myconfig.ini。你可以把命令写到.bat文件里,方便使用。

(考虑过使用类似git的多层配置结构,但是考虑到用户的学习成本,以及多层配置结构出现配置错误时难以查找的问题,故而放弃了这个想法)

能否添加对某个站点的支持?

  1. 请确认从现有的站点均无法找到你要刮削的影片,或者现有的站点抓取的数据有大量缺失。
  2. 确认了1之后,如果你希望添加某个站点,请发issue,说明希望添加的站点地址和简单介绍,以及在该站点上独有的影片的番号
  3. 开发者会视当前开发任务进行开发,2中的说明越详尽越有助于尽快完成新站点开发

如何抓取JavDB中的FC2影片

JavDB已经将FC2影片设置为在浏览器端仅限VIP访问,在启用javdb作为FC2类型的影片的抓取器后,软件会先尝试获取你在JavDB的Cookies(用户登录后获取的凭据),如果你是VIP则可以正常抓取(不推荐专门开VIP)。

如果获取不到有效Cookie或者不是VIP,软件会自动转为从搜索页面抓取影片,这种模式下能获得的内容信息有限,不过总胜过一无所获。

如果你是VIP,请在登录JavDB时选中“保持七天登入狀態”。

此功能只支持Chromium系的浏览器。由于很多国产浏览器虽然是基于Chromium,但是做了很多定制化修改,因此无法解析这些浏览器的Cookies。目前支持的有:

  • Chrome(含正式版、Beta版、Canary版及Chromium)
  • Chromium内核的Edge浏览器
  • Vivaldi浏览器

以多用户模式(多个Profile)使用这些浏览器不会影响Cookies解析,只要任意一个用户登录了JavDB即可。

此外,如果你使用的是绿色版或者各类内置定制化修改版的Chrome,可能也会出现无法解析Cookies的情况。

JavDB的Cookies有效期是多久?必须在它的永久域名登录才可以吗?

7天,因此超过7天的话可能会需要重新登录。

可以登录任意一个JavDB的域名,即从JavDB发布的防屏蔽地址登录也是可以的。

如果你登录了多个域名,则多个域名对应的Cookies都有效,这种情况下如果软件检测到其中某个域名下的Cookies失效时会自动更换别的Cookies。

如何处理多部不同影片使用相同番号的情况

虽然这样的情况很少很少,但是可能还是会遇到。例如MIDV-001,如果你在JavBus进行搜索,会找到两部影片,一部发布于2021-11-12,另一部发布于2009-10-06。JavSP整理时,你可能会看到如下结果:

正在整理: MIDV-001.mp4
'MIDV-001': 出现3个完全匹配目标番号的搜索结果,为避免误处理,已全部忽略
重命名文件: 'MIDV-001.mp4' -> '...\MIDV-001.mp4'
整理完成,相关文件已保存到: #整理完成\小池絵美子,永井絵理香\[MIDV-001] 男と女のワイドショー ある愛の形

如果你的影片恰好就是JavSP所识别到的这部(发布于2009-10-06的),那一切照旧,不需要手动处理。如果不是,按照下面的步骤处理:

  1. 去你想用的站点上搜索这部影片,得到它在站点上的番号
  2. 将你当前的配置文件复制一份,例如复制成manual.ini,然后修改CrawlerSelect配置,只保留你想用的站点
  3. 在CMD窗口中,使用参数-c指定配置文件,使用参数-m all进入手动模式,即JavSP -c manual.ini -m all
  4. 在JavSP运行时告知影片的正确番号

示例,假如通过搜索得知,影片在JavBus上的实际番号为MIDV-001_2021-11-12

C:\Data\JavSP>javsp -c manual.ini -m all
扫描影片文件...
扫描影片文件:共找到 1 部影片

进入手动模式检查番号:
[1/1]   MIDV-001, 对应文件:
  MIDV-001.mp4
回车确认当前番号,或直接输入更正后的番号(如'ABC-123'或'cid:sqte00300')MIDV-001_2021-11-12
已更正影片番号: MIDV-001.mp4: MIDV-001 -> MIDV-001_2021-11-12

正在整理: MIDV-001.mp4
重命名文件: 'MIDV-001.mp4' -> '...\MIDV-001.mp4'
整理完成,相关文件已保存到: #整理完成\夢見るぅ\[MIDV-001] グラビアソープ 夢見るぅ

影片番号识别错误导致影片被错误整理怎么办

程序记录了每一次文件移动操作前后的文件名,并且为了方便追溯,单独记录到了FileMove.log日志文件中。你可以在其中看到每个文件的移动详情,找到被错误重命名的文件后,将它恢复为正确番号的文件名,然后重新运行程序进行整理即可。

重新整理时,如果不想使用自动识别到的番号,你可以手动指定影片文件的番号,参考上一节的说明。

如果有某个系列的影片番号批量性识别错误,可以去这里报告问题