- UID
- 238208
- 精华
- 0
- 冰点
- 99
- 阅读权限
- 100
- 主题
- 115
- 回帖
- 3885
- 性别
- 男
- 在线时间
- 699 小时
- 注册时间
- 2019-7-6
- 最后登录
- 2025-1-11
签到天数: 800 天 [LV.10]以坛为家III
炎之精灵LV.1
- 回帖
- 3885
- 雪点
- 91677
- 阅读权限
- 100
- 性别
- 男
- 在线时间
- 699 小时
- 注册时间
- 2019-7-6
- 最后登录
- 2025-1-11
|
本帖最后由 yanggw13 于 2022-1-8 14:24 编辑
此贴已过时,请移玉步到v2
SVP重大更新已经过去了大半年了,旧版的教程已经过时了,有很多不适用于现在的版本。
因此,新的一年重新开讲【高质量补帧讲座v2】,新讲座暂定为七讲,除第一讲为通用,其余为新增或重写;希望在元旦假期能够更新完成。
v2新版链接:
【高质量补帧讲座一】序言:SVP补帧、madVR渲染、去色带、缩放的 介绍 及 必要性
https://www.deainx.me/thread-75936-1-1.html
【高质量补帧讲座二v2】硬件篇:SVP补帧+madVR渲染所需硬件指导
https://www.dranime.net/thread-85367-1-1.html
【高质量补帧讲座三v2】安装篇:安装LAV、potplayer、MPC-HC、SVP、madVR
https://www.dranime.net/thread-85376-1-1.html
【高质量补帧讲座四v2】配置篇:MPC-HC/potplayer+LAV+SVP+madVR
https://www.dranime.net/thread-85380-1-1.html
【高质量补帧讲座五v2】不良问题应对:丢帧BUG、花屏BUG、强制反交错(限potplayer)
https://www.dranime.net/thread-85414-1-1.html
【高质量补帧讲座六v2】方案匹配:potplayer、SVP多方案自动匹配
https://www.dranime.net/thread-85425-1-1.html
【高质量补帧讲座七v2】媒体中心:kodi多媒体中心简介及调用第三方播放器
https://www.dranime.net/thread-85427-1-1.html
旧版链接:
【高质量补帧讲座 一】SVP补帧、madVR渲染、去色带、缩放的 介绍 及 必要性
https://www.deainx.me/thread-75936-1-1.html
【高质量补帧讲座 二】potplayer+SVP+madVR教程,无伪影、无扭曲、动画字幕,完美方案
https://www.deainx.me/thread-75946-1-1.html
【高质量补帧讲座 三】potplayer+SVP+madVR / EVR(CP)的硬件性能需求
https://www.deainx.me/thread-76446-1-1.html
【高质量补帧讲座 四】USB采集卡+VLC+SVP让电视盒也补帧
https://www.deainx.me/thread-77570-1-1.html
上一讲教了大家如何配置好SVP补帧及渲染器。不过很快大家会发现这玩意非常消耗硬件性能,可能有些硬件配置并不高的小伙伴会变得非常卡机。
可能有些小伙伴想要通过升级硬件来变得流畅,这时候会苦于到底选用什么性能级别的硬件才合适。我也被这个问题困扰过,于是我花费了将近两个月时间并购置了二手的双路平台进行测试,推算并确立性能指标。
这里要说一下双路的问题:
双路CPU算力是可以成倍叠加的;但双路的内存吞吐量由于软件优化问题,SVP并没有将其叠加。
双路平台必须两路都插内存才能运行,这个观点是一个误区,根本没用过双路的人才会这么认为。事实上,只需要在主路(CPU0)上插内存就可以,多路CPU均能运作,算力不打折。
鉴于SVP不叠加多路内存带宽,所以省点钱,插单路的内存就够了。
解码、渲染主要以浮点运算为主,主要的性能指标有三个:
1、CPU浮点运算能力
2、内存吞吐量(速度)
3、显卡单精度算力
1、CPU浮点运算能力,以Cinebench R15跑分作为参考
上网可以搜到各CPU跑分成绩,提供一个纯文本的排名,以便Ctrl+F搜索:https://lanfutun.com/article/41
SVP支持多路CPU,多路能成倍叠加算力
2、内存吞吐量(速度),直接以 内存频率*通道数量 为指标
SVP没有优化多路平台的内存吞吐量,例如双路*4通道,并不能发挥出8通道,而是4通道性能。
3、显卡单精度算力,两个渠道获得:A、官方公布;B、aida64 GPGPU 跑分结果,两者是相同的。
首先我们回顾一下,有哪些影响性能消耗的主要因素,这些因素都需求什么。
potplayer解码输出的色深:大幅度 需求 内存、CPU,对显卡无需求
SVP着色器选项:小幅度 需求CPU
SVP渲染设备:大幅度 需求 内存、CPU,选择纯CPU会占用非常大的CPU算力和内存吞吐量,几乎翻倍的量
madVR:大幅度 需求 显卡,根据选用的算法不同,越强悍的算法性能要求越高。
EVR(CP):也是需求显卡算力,与madVR相比,EVR效率低下,在高帧率高分辨率下,性能消耗比madVR大,但是效果更差。不过在低分辨率下,性能需求要比madVR少。
所以当CPU或内存不够强悍的时候,可以通过调整potplayer、SVP的设置来解决。
当显卡算力不足,可以通过调整madVR的算法来解决。
那么我们如何知道自己的电脑是CPU、内存、显卡三者中,那一样成为瓶颈呢?软件本身自带监测,通过其监测数据就可以知道。
打开SVP监视器界面。我们主要看SVP指数、CPU占用率,这两个指标。
占用率不用多说,主要是SVP指数是什么呢?
SVP指数=实时帧率÷目标帧率,很直观体现出,补帧率是否达标。
比如目标要补到60fps,而实际输出达到60fps,SVP指数就是1.00。这时候是正常画面播放速度
又比如目标要补到120fps,而实际输出只达到60fps,SVP指数就是0.50。这时候是0.5倍慢放
如果目标要补到60fps,而实际输出达到90fps,SVP指数就是1.50。这时候是1.5倍速快进
换一种更好理解的说法,SVP指数是画面播放的倍率,并且这个倍数与声音是分离的。
很显然,正常理想状态就是让SVP指数保持1.00,不要多不要少。
不过,这个SVP指数有大于1.00的情况。当我们刚开始播放视频,会有一个缓冲阶段,这时候不能瞬间达到满帧,这就导致画面变慢,声画不同步了,此时会自动加快帧率追回这个落后部分以达到同步。所以会出现大于1.00的情况。也有时候是因为一些高峰值部分运算不过来导致缓慢,之后高峰压力过去了也会加快帧率。这样就导致画面时快时慢。所以一般来说,CPU应该留有足够的闲余算力,避免后台占用以及高峰因素导致的这种缓慢问题。
一般我建议最低限度是确保平均CPU占用率不要大于80%
我反复通过降低CPU主频、内存频率的方式,试图找寻又会什么因素导致SVP指数不足。最终得出的结果是,两者均有影响。那么如果判断自己的瓶颈是CPU还是内存呢。
情况一:CPU占用率95%~100%,SVP不足1.00
这时候很显然是CPU算力不足。
情况二:CPU占用率50%,SVP不足1.00
这时候CPU的算力位能够完全利用上,很显然瓶颈在内存速度。
但是有没有可能其实内存、CPU均不达标呢??
在进一步分析
套用一个算式去换算:SVP指数÷CPU占用率=理论极限。
这个理论极限大于1代表CPU算力是够的,小于1代表CPU算力不够。但是前面说过,仅仅够不行,要留闲余算力,所以推荐在1.2以上,不然很容易音画不同步。
情况三:CPU占用率60%,SVP指数0.85。
根据算式,CPU算力足够,瓶颈是内存速度
情况四:CPU占用率50%,SVP指数0.45。
根据算式,CPU和内存速度均达不到性能要求
回顾情况一:CPU占用率95%~100%,SVP不足1.00
实际上,CPU算力一定不够,但是内存速度是否足够是不可确定因素。
另外,CPU占用率那里是可以看到CPU主频的,如果发生频率降低的现象,证明散热器的散热能力不足,需要升级散热器了。跑SVP比大型3D游戏的CPU性能消耗要大上很多倍的,而且会一直保持满频率状态,所以非常热。
通过以上检测方法,可以基本确立CPU、内存的性能级别。剩下就是显卡了。
渲染掉不掉帧,唯一因素是渲染时间。
也就是一幅画面花了多久的时间渲染并发送给显示器,如果超时就导致舍弃(掉帧)。
我们播放视频时,通过Ctrl+J快捷键,可以开启madVR的OSD信息。其中我们主要关注这几个信息。
vsync :屏幕刷新间隔时间
dropped frames :累计丢帧数量
average stats :平均渲染时间
max stats (5s) :5秒内最大渲染时间
vsync :屏幕刷新间隔时间
1秒是1000ms,以60hz,每秒刷新60次画面,所以每次刷新的间隔时间为1000/60=16.67ms。截图中我是75hz的显示器
dropped frames :累计丢帧数量
每当有丢帧的时候,都会累加这个总量,通过看这个数是否增长就知道有没有丢帧。通常第一秒都会丢一些帧,是正常现象,除非电脑设置为待机满主频就不会了。所以有几十是正常的,每次拉进度条也会丢,只要播放时候不增长就正常了。
注意丢帧有多种因素:
a、渲染超时(显卡渲染能力不足)
b、解码丢帧(就是前面CPU、内存性能不足导致的帧率不足)
c、垂直同步舍弃多余画面(拿120fps的片,在60hz的屏幕播放,其中60fps是多余的,垂直同步起作用,这部分不会发送给显示器,因此每秒都会增加60)
很显然,只有a是因为显卡性能不足,其他都不是显卡问题。那么我们进一步明确是不是渲染超时。所以就看下面的渲染时间了。
average stats :平均渲染时间
平均每一幅画面花了多少ms渲染完成。只要渲染时间,小于刷新间隔(vsync)那么理论上,就能稳定输出画面了,不会丢帧。假如渲染时间大于刷新间隔(vsync),也就是渲染跟不上刷新速度,这就会丢帧了。是显卡性能不足。
max stats (5s) :5秒内最大渲染时间
不过仅仅看平均值是不够的,只要有任意一幅画面渲染时间大于刷新间隔(vsync),那该画面就有可能被舍弃了(丢帧)。通过看最大渲染时间,以确认每一幅画面渲染时间都足够短。所以平均时间仅仅是一种参考,最关键看最大时间。我们通过看最大时间去评定这块显卡有没有足够性能,能不能够在提高算法的强度,还是应当降低负荷。
假如:vsync=16.67,max stats (5s)=20ms,那么我们需要20/16.67≈1.2倍于现在的显卡性能。
小结显卡这部分:
首先通过观察dropped frames是否增长快速判断是否有丢帧现象。
然后通过对比max stats (5s)是否大于vsync而判断丢帧是否显卡性能不足导致,大概差多少倍性能。
我花了一个多月时间去测试,得到的当然不仅仅是上面的测试方法了,下面分享部分原始数据,以供参考。并且我基于这些数据,去预测各级别的性能需求,大家可以参考表格去选购性能指标达标的硬件组装一台播放主机。
由于进行该测试时,不知道解码输出色深对性能需求有明现影响,因此测试时未考虑输出色深条件,统一以对应色深解码输出的,并没有8bit的参考。而且做一遍测试也非常麻烦,所以也不会再做一遍锁定8bit的。
CPU的原始数据
采用madVR渲染
采用EVR(CP)渲染
基准分数是当时我做测试的CPU的R15跑分,理论分数是根据该测试结果,套用算式得出一个理论性能需求,为保留一定闲余性能,建议在这个基础上*1.2倍。
软解码的意思是,只做了解码,没有开SVP补帧。
内存的原始数据
表中均为双通道,比如说,表里面写4000,那么2000*四通道是等效的。
采用madVR渲染
采用EVR(CP)渲染
你会发现采用EVR(CP)渲染器的话,CPU、内存的性能需求要少一些。因为EVR(CP)是自带的渲染器,解码后直接交给渲染器就算完结。而madVR是第三方渲染器,渲染完成之后还需要回传结果给播放器加字幕,数据传输次数多了。
显卡算力需求
采用madVR渲染测试条件是把madVR用低档的缩放算法
采用EVR(CP)渲染
EVR(CP)没有很准确有效的测试方法,所以这个表不太准确,而且我根本就没测试默认的8bit整数,而是测试质量更高但是性能消耗比madVR大的32bit浮点。
另外附上整理到的一些显卡单精度性能
根据以上结果,统筹出各显示器刷新率及视频分辨率对应需要什么性能级别。
表中的内存频率,为单通道,例如表里4800,对应为双通道2400即可.
补充一下,为什么75hz开始,4K的性能需求那么变态。因为我把4K@60fps的片源也算上了,4K@60fps补到75fps。还记得我曾经说过吗?资源占用主要不是看补多少帧,而是原始视频的帧率才是最重要因素。
最后是导购环节
根据上表,以及结合实际使用环境,大致上分为几种常见级别:
小白级:
能流畅看1080P视频,不知道硬解码、补帧的、渲染器为何物
配置:
随便一颗G奔腾,用核显就能软件看
4K小白级:
能够流畅看任何4K片,不知道硬解码、补帧的、渲染器为何物
这种小白级,就是你帮什么都不懂的亲友,导购的重要依据了。虽然很明白,只要不用SVP补帧的话,硬解码4K弄个1050ti然后随便搭一颗赛扬CPU就够了。但是最怕不讲理的不懂开硬解,软解卡机的时候怪你,所以这里就按照软解去考虑问题。
配置:
六核12线程CPU、DDR4 2400双通道、显卡RX580或GTX980
动漫性价比:
花最少的钱,完美爽看动漫
配置:
4核8线程2.8G主频CPU(E3-1220/E3-1230/i7-2600)这些CPU超便宜,不值钱,主板也不值钱
不过要注意,E3系列需要打鸡血,不懂打鸡血就不要用,会降频。不懂的加钱买i7-2600
DDR3 1600 4G *2
随便买一块100元的二手独显
电源也是随便50包邮淘二手
不算硬盘,大概500~600RMB可以搞定。
4K影音电视:
电视机都是60hz的所以把60帧定义为给电视机用的。
配置:
CPU E5-2658 V3
主板 X99
内存 DDR4 2133 4G *4
显卡 RX470
电源 500W
不算硬盘,淘二手大概1400~1600RMB
主流PC:现在的显示器,开始主流72hz/75hz了,所以给PC使用,基本上以72/75帧来考虑
75hz以上是比较绝望的,配置要求太高了,不想说。
电竞PC:电竞屏幕比较低门槛是120hz,给电竞屏幕用,需要考虑120帧,不过你会发现性能需求太变态,现在根本不存在可以这么补的家用配置。理性的做法应该是桌面、全屏分辨率降到75hz。
在比价的过程中,我发现,相同性能下,多核心低主频CPU要比少核心高主频CPU便宜。在测试过程中还发现,同性能下,多核心比高主频更有优势。这恰好和游戏是相反的,如果该主机没有大型游戏的需求,建议通过增加核心数量,而非选择高主频。
显卡的选择,既不是越新越好,也不是3Dmark跑分越高越高。用途不是玩游戏,3D游戏性能好,并不代表单精度算力高。只有单精度算力高才是硬道理。我发现,新一代的显卡同级别的游戏性能是提升了,但是算力提升甚微,nv的甚至算力开倒车。所以买新卡性价比会非常低。除非你是有游戏需求,不然建议买老卡,越老性价比越好,不过太老会浪费电。其实需求和挖矿是相同的,基本上买挖矿热门卡型就对了。RX4xx/5xx这一代是最理想的。nv任何一款显卡都性价比不好,除非你玩游戏。
有什么疑问欢迎跟帖提问。文字随便乱写的,有些表达确实不太好理解。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|