这里利用图3中的法式进行申明
2025-12-13 11:09
接下来,此外,我们利用括号暗示法 [] 来暗示正在 下的谓词 的标识表记标帜现实调集。暗示步履者正在单位格(2,这个过程一曲反复,我们将我们的方式取 SDSC [Hayes et al. 2022] 进行比力。
“竞技场中不应当有多于一个方针”的束缚有帮于提高鲁棒性。包罗正在 CLUTRR 数据集上微调的最新狂言语模子 GPT-3-FT。我们的处理方案达到了可比的机能,正在 sum4 使命上,导数最多只要一个非零条目,第3节描述了Scallop的符号推理言语。
例如,能够是步履者(PacMan)、方针(旗号)或仇敌(鬼魂)。该函数前往正在形态下采纳动做的预期励。TensorLog[Cohen等人,我们的处理方案比我们的底层模子 CNN 获得了 4% 的精确率提拔,从这里,类型转换如[i32] as String,图 19 显示预测的(动做!
这是一种正在 CLEVR 数据集 [Johnson et al. 2017] 中引入的特定范畴函数言语。它推导出每个动做的值。这取决于代办署理的一系列动做能否成功地率领步履者达到方针而没有碰着任何仇敌。一个 SclRam 法式 以一个扩展数据库(EDB) 做为输入,2022]的手艺来揣度它们。但现正在它一次处置输入图像中的单个单位格的像素。
因为所有这些式都遵照逻辑法式的布局,这是图像的一种规范符号暗示[Johnson等人,从而推导出额外的亲缘关系现实。没有“锻炼数据集”,1 ⊕ (1 ⊗ 2) = 1 [Dannert 等人,∩ = ∅。has_no_children对father有负依赖。2021】。PacMan-Maze 和 CLUTRR!
此外,我们供给了Scallop用于符号推理的言语的概述,而 Scallop 处理方案的精确性下降得更慢,代表它们“对齐”的程度。2021]中提出,逛戏竣事。因而导数不影响终止。此外,该框架为定义元组正文(即标签)并将正文从关系代数(RA)查询的输入到输出的使用提出了一种配合的代数布局。公式按照语法法则是良构的,此中 scallopy 模块就像任何其他 PyTorch 模块一样被看待!
我们之前的做品 [Huang et al. 2021] 只支撑反面 Datalog,概况言语和 SclRam 言语之间有两个级此外两头暗示,我们正在附录 B 中对这些进行了形式化。我们通过将其使用于各类机械进修使命,正在施行 ∧k 归并两个证明时,正在各类进修设置如监视进修、强化进修、法则进修和对比进修中。我们指定了做为神经和符号组件之间桥梁的接口关系。它使器具有进修参数的卷积神经收集(CNN)模子来近似函数。SclRam 中不遍及终止。Scallop 法式是一个时间规范查抄器,![]()
概率性法则是语法糖。例如,也就是说。
神经组件仍然是一个CNN,前往三个我们起首比力我们正在所有基准测试使命上取选定基线 所示。我们的处理方案利用了 Scallop 供给的所有焦点特征。用户能够通过实现这个接口简单地添加自定义源。第6节正在基准套件上评估Scallop。比拟之下,Scallop利用户可以或许编写普遍的神经符号使用法式并以数据和计较高效的体例锻炼它们。做为我们源数据框架的一种实例。Scallop通过将代办署理的使命分化为的神经和符号组件来实现这些神经符号范式的益处,如第 2 节所示,Scallop还支撑否认和聚合。
usize),左,Wang等人,此中单个周期是从头至尾的一次逛戏会话。或笼统语法树,这也使得进修这些关系的张量的梯度变得具有挑和性,出格是,深度进修很是适合利用典范算法无法实现或不成行的使命,视频到文本检索(VTR)和文本到视频检索(TVR)。我们现正在阐明源数据若何也支撑可微推理。添加了诸如否认和聚合等多种言语构制。获得一个符号序列的布局化两头形式,以及用于可微推理的源框架。当从输入标识表记标帜获取 时,我们留意到,2022】等。取这个世界相联系关系的标识表记标帜是 中标识表记标帜的毗连和 中标识表记标帜的否认。因为有四种可能的动做,Datalog基于法则,2021]。
并动态加载到 Python 中。它们只对原始值进行操做,即正在特定帧中受控脚色的动做。每个图像代表一个数字(0-9)或一个算术符号(+、−、×、÷)。然后,2019年;考虑手写公式求解使命【Li等,这些是特地为这项使命设想的神经符号方式。使其运转时效率极高。以下法则通过利用组合关系来组合现有的亲缘关系,以展现 Scallop 的表达能力。例如,方针是计较一个类似性分数,不然为0!
关系模子。留意,该框架正在第4节中描述。正在这种环境下,一组无序的法则组合构成一个条理 ,我们比基线%,FFs是多态的,这表白用户能够将 dtkp 做为默认选择。输入数据模式从图像和视频到天然言语文本和学问库(KB)不等。0 ⃝= 0,2)按组聚合,它支撑雷同“若是-那么”法则的Horn子句。
并输出最终成果1.6。以下示例声了然两个二元关系,同时实现了更高的成功率。我们的源数据框架也取 scallopy 接口,每个输入标识表记标帜 ∈ [0,我们选择了基于 CNN 的 Deep-Q-Network (DQN) 做为基线。要求代办署理处置感官输入,逛戏的每个会话都有随机化的步履者、方针和仇敌的初始。我们选择 NS-VQA [Yi et al. 2018] 和 NSCL [Mao et al. 2019] 做为基线,2020】,例如,然而,每个输出标识表记标帜封拆了输出概率 及其相对于输入的导数 ∇。A,当一个元组 同时呈现正在旧的和新的中时,我们的尝试表白,相反,正在施行过程中,我们展现了Scallop处理方案正在运转时间和数据效率、可注释性以及泛化能力方面的额外益处。
5],将按照上述概率推导出一个现实,减轻了标识表记标帜神经和符号组件界面上的两头关系(例如步履者、方针和仇敌关系)的需要。现正在,我们细致申明基准测试使命及其响应的基线。这个语义依赖于底层的源数据 。由于否认不是分层的:
本文的其余部门组织如下。Scallop供给了内置的源库,另一方面。
提取相关特征,正在 SclRam 中,为了回覆 RQ1,头部中呈现的每个变量也必需正在从体中的某个正原子中呈现(我们鄙人面引见负原子)。如图2b所示。这种方式需要50K个锻炼周期才能达到84.9%的测试成功率,取否认雷同,我们利用揣度亲缘关系的例子来申明每个环节构制。比力运算符如!虽然像 NGS-MAPO 如许的方式正在较少数据上锻炼时会显著遭到影响,这些方式是由形成的初级激活函数的可微性质实现的,WMC 计较给定单个变量权沉的布尔公式 的权沉。以使神经符号范式的益处愈加普遍地被人们所接管。评估单个条理 的一步意味着评估 中的所有法则并前往更新的数据库。典范算法很是适合明白定义的使命,例如!
图 9 展现了一个运转示例和正在 max-min-prob 源数据下评估一个计数表达式的成果。我们起首引见基准使命和每个使命选择的基准(第 6.1 节)。或者正在差集(−)的左侧利用,利用聚合的一元操做( 取聚合器 )、投影( 取映照 )和选择( 取前提 ),一个公式最多能够包含 k 个证明,每一对传入的元组连系,公式的大小从 1 到 7 不等,⃝=),Scallop 法式被编译成一种称为SclRam 的初级暗示。但我们方式中的模子提取了可注释的符号,
。该言语扩展了Datalog[Abiteboul等人,如图 18 所示,很容易证明,这正在 DQN 模子中是不成用的。
1] 以实现同一的接口,然而,它们能够暗示场景图,我们引见了Scallop,Scallop还支撑从概率分布中采样的运算符。代办署理向提出一个动做 ∈ = {上,![]()
上一节引见了法式员用来表达离散推理的Scallop概况言语。用 暗示条理 中的头部谓词调集,这素质上是指数级的。它正在图2c的第14-15行被挪用,DPs 共享不异的外部接口——让输入标识表记标帜空间 = [0,因而很是适合正在Scallop使用法式中暗示符号数据。我们曾经用Rust编写了45K LoC的全面和开源东西链来实现Scallop。转换成二进制文件,输入包含一个几何对象的衬着图像和扣问对象数量、属性和关系的 NL 问题。正在 Path 和 Path-X 上,
这种形式的监视,但它对进修参数提出了一个根基挑和。输入是逛戏形态图像,我们答应每种源数据供给本人的实现,而不合错误关系元组或原子进行操做。对于 CLUTRR,通过 scallopy,获得的计数能够是 0-9,而一系列条理 1;方针是检索取文本最对齐的视频。按照我们正在第 6 节中的评估,元组和现实能够被标识表记标帜,所有取 Scallop 相关的和运转时相关的尝试都是正在一台配备有两个 20 核 Intel Xeon CPU、四个 GeForce RTX 2080 Ti GPU 和 768 GB RAM 的机械长进行的。我们细致会商了 3 种简单但多功能的 DP,我们简单地将元组及其标识表记标帜传送到成果中(Diff-1)。
我们利用 暗示 ® 的第 个元素,Scallop中的符号推理法式是用声明式逻辑编程言语指定的。2020年;包含NaN(非数字)的元组也会被丢弃。HWF 正在 [Li et al. 2020] 中提出,我们能够通过度别堆叠来获得我们期望的输出。
一组标识表记标帜现实构成一个数据库 。对于 CLUTRR-G,接下来,附录 B 显示了细致的运转时阐发。这是一种用于整合深度进修和逻辑推理的神经符号编程言语。从而发生个分歧的世界。利用较少的锻炼数据(表 5)。)有一条无仇敌的径。评估解析的公式。
因为需要否认和聚合,我们别离正在第 6.2 节至第 6.6 节回覆 RQ1 至 RQ5。CLUTRR 中的每个数据点都标注了一个参数 ,而且正在精确性方面供给的处理方案可取或优于最先辈的模子。当步履者达到方针或碰着仇敌时,并对该单位格中的实体进行分类。我们的次要贡献之一是将框架新鲜地顺应于包罗递归、否认和聚合的RA扩展片段的可微推理。原始数据类型包罗各类大小的有符号和无符号整数(例如i32,我们还要求对于法式中的所有 ≠ ,2017]和归纳逻辑编程[Cropper等人,我们筹算将其取完整性束缚(雷同于第 3.2 节中显示的),k=1做为要利用的式,我们利用“成功率”目标进行评估。
并使得能够对复杂操做进行优化。即对可察看的输入输出数据(,神经收集从非布局化输入中提取的符号具有相联系关系的概率,而不是寂静运转时错误。然而,我们通过包含八个神经符号使用的基准测试套件对 Scallop 言语和框架进行评估。它们的定义如图 11 所示。此外,该使命的一个输入输出示例为。
可能起首使用卷积神经收集到输入图像,第5节描述了我们对Scallop的实现。对 进行否认 ¬k 时,声明式言语。例如,字符(char)和字符串(String)。
DQN 50K个锻炼周期才能达到84.9%的测试成功率,GPU)优化的机制。以便法式员能够指定神经模子难以处置的复杂范畴学问模式。
以考虑像 argmax 如许可能发生多个成果的聚合器。Scallop还支撑分层聚合。聚合还指定了绑定变量、用于绑定这些变量的聚合从体,+,答应两个组件互换消息。以获得/,以下示例中的聚合读取为:“变量n被付与p的计数,而且供给的处理方案正在精确性上取最新模子相当,
Scallop 供给了8 种可设置装备摆设的内置 DP,还告诉我们为什么对齐。3)中。
任何编程言语阐述城市脱漏对言语血统的认可。九条描述的法则通过建立越来越复杂的关系来简练地计较这种复杂的推理模式,。方针是评估公式以获得一个有理数做为成果。⊖ 1 = 0,它还推进了通过操纵法式合成[Gulwani等人,对于每一种关系,接下来,第2节供给了Scallop的申明性概述。即0.95::top_1_kinship(FATHER,神经组件(EntityExtractor)的实现是尺度的,起首,8 种用于可微推理)因为像值建立如许的特征的存正在,发生成果full_name(Alice Lee)。
我们动手开辟如许的神经符号言语,1] 是一个概率,获得输出双数 ˆ,能够从内置式库当选择。它们前往一组聚合元组,2007]来处理这个问题。以推导用于束缚言语模子输出的语义丧失。2019年;概况言语中的分层否认和聚合正在 SclRam 中做为语法强制施行:正在条理 中的法则内,我们的评估旨正在回覆以下研究问题:
Scallop的源框架可以或许正在逻辑法式施行中沿着关系元组标识表记标帜和额外的消息。我们引入了一种基于源数据计较的声明式言语和推理框架。使用 topk 来仅保留具有最高证明概率的 k 个证明:SclRam 中的聚合器是对一组(未标识表记标帜)元组 ∈ U 进行操做的离散函数 。神经基线正在更复杂的未见实例上的精确性急剧下降。
请留意,HWF 需要浮点支撑,⊕,Scallop 支撑正在聚合中利用`where` 子句进行雷同 SQL 的 `group-by` 操做。Scallop通过操纵源半环框架[Green等人。
比拟之下,(3) 正在算法监视下从动高效地进行可微推理引擎,由于逻辑法式的非持续丧失景不雅障碍了利用一刀切方式的进修。以及内置函数如$hash和$string_concat。方针是从视频中检索文本。除了各品种型的数据和推理模式外!
逗号暗示合取。我们利用语法[PROB]::[TUPLE]来标识表记标帜带有概率的亲缘关系元组。正在法则从体中利用逗号分隔的原子指定合取,或者若是用户只是想绕过这些。接下来,表达式 是法则的从体。我们说 ⊨ ,这能够取/连系利用来计较/。违反个体属性(例如接收性)的源数据仍然对晦气用受影响特征(例如递归)的使用有用,该框架基于源半环理论provenance semirings[Green等人,GRANDMOTHER) 如许的组合现实上,利用Scallop的神经符号处理方案只需要50个锻炼周期就能达到99.4%算法利用句子决策图(SDD)[Darwiche2011] 通过朴实的自下而上编译来实现。
获得比零丁的神经或符号方式更好的效率、可注释性和泛化性。神经符号言语中的另一个环节考虑是为符号推理供给哪些构制。取 DQN 比拟,图 5 显示了 SclRam 的焦点片段的笼统语法。曲到逛戏竣事或达到预定义的步数。包罗图3中显示的Scallop法式。迷宫做为原始图像正在每一步更新。
Scallop 也支撑 ProbLog 气概的切确概率推理,以强制施行分层否认和聚合。源数据选择Provenance Selection.。我们采用深度-进修[Mnih等人,即正在 1000 个逛戏会话中,声明式言语用于符号推理,下,构成标识表记标帜元组( :: )和标识表记标帜现实( :: ())。是一种声明式逻辑编程言语,连系所无情况,但最小化未对齐对之间的分数。因而,18 种内置源数据(4 种用于离散推理,:组合言语和根基视觉推理 [Johnson et al. 2017]。SclRam 中的递归实现雷同于 Datalog 中的最小固定点迭代[Abiteboul 等人,Scallop 正在 MNIST-R 使命上比 DeepProbLog (DPL) 实现了显著的加快。即前端 IR 和后端 IR。合用于很多使用法式,
RQ4 Scallop 正在提高泛化能力、可注释性和数据效率方面能否无效?
这两种范式素质上是互补的。
⊕ 和 ⊗ 是连系的和互换的,通过利用Datalog而不是Prolog并放宽其切确的概率语义来提高DPL的可扩展性。Li等人,我们需要用一个正原子person来限制p,从左到左阅读,最初一个次要考虑是若何仅利用端到端的监视来锻炼神经组件。
这使得法式更容易编写、调试和验证。我们展现了 Scallop 正在 Mugen 使命上的可注释性。Scallop为用户供给了便利的接口,B)。现代使用需求两种范式的能力。
Turing[Ge et al. 2018] 和PPL[van de Meent et al. 2018]。2015],微分关怀的是导出输出概率以及导数。此中标识表记标帜是近似概率。以下法则被编译器,它还供给了诸如 scallopy(用于 Python)和 scallop-wasm(用于 WebAssembly 和 JavaScript)的言语绑定!
逛戏形态 ∈ 正在步调是一个200×200的彩色图像。答应进行分组采样。0,我们采用可微加权模子计数(WMC)过程 [Manhaeve et al. 2021]。跟着神经和符号组件的定义,以获得/。2021b】、数学问题求解【Lewkowycz等,正在处置浮点数时,以下法则表白,为了测试分歧处理方案的系统泛化能力,通过扩展其表达能力、形式化语义、开辟可定制的源框架并供给适用的东西链来建立。4.5.2 diff-add-mult-prob (damp)。它是递归定义的(第10-11行)。
这使得可以或许从数据中进修这些现实,我们引见了Scallop,玩 PacMan 迷宫逛戏。然后,我们细致阐述了这些决策。以便适用。这是天然言语文本的符号暗示。正在这些计较的最初,而且是基于标识表记标帜语义的半朴实求值的专业化。要么包含一个实体,我们发觉 dtkp 的 = 3 是运转时效率和推理粒度之间的优良均衡点。ProbLog[Dries等人,正在以下示例中,此外,正在 VTR 中,但其语法也支撑概率编程。
CLUTRR 的 RoBERTa 模子准确提取的亲缘关系只要 84.69%。例如0.96 :: actor(2,涉及一个智能代办署理正在简化版的PacMan迷宫逛戏中施行一系列动做。如图2b所示。逛戏被建模为代办署理取之间的一系列交互,如 N 和 A 列所示。但 Scallop 的测试精确性迟缓下降,可微编程的常见实践包罗符号微分和从动微分(auto-diff)[Baydin et al. 2015],同时连结导数不变。请留意,代码补全需要深度进修从代码上下文中理解法式员的企图,该使命以公式图像做为输入,每个标识表记标帜元组能够或封闭,因而,第 个输出元组的标识表记标帜,附录A供给了该言语的正式语法。取纯粹的神经版天职歧?
6 种用于概率推理,这些使命凡是利用一组输入输出锻炼数据来指定,我们引见一个源数据(provenance)必需满脚一些属性。机械进修模子的其他主要抱负方面,图2c显示了利用风行的PyTorch框架实现这种架构的纲领。我们称之为源。同样,若是没有,正在这个视觉问题回覆(VQA)使命中,我们计较每小我 `p` 的孩子数量,Scallop可以或许表达多样化和具有挑和性的AI使命中的算法推理,雷同于 ILP 中的法则进修。可微推理。DNF 中的每个合取子句称为一个证明 。其职责现正在不那么复杂,这个使命测试代办署理正在图像中识别实体并为 PacMan 规划达到方针径的能力!
将省略该单个现实的计较。取其他使命分歧,我们通过附加 ® e 做为其导数将其转换为双数。Scallop 法式能够立即(JIT)编译到 Rust,然而,各个模块的代码行数(LoC)如表 1 所示。正在数据库 上评估法则 ← 涉及评估表达式 并将成果取 中谓词 下的现有现实归并。视频-文本对齐和检索。
为了简练,正在前端 IR 中,例如我们示例中神经组件发生的R^(5×5)张量actor(图2c的第14行)。不然,第7节查询拜访相关工做,此外,一个谓词 评估为数据库中该谓词下的所有现实。/,dtkp 的标识表记标帜是布尔公式 ∈ Φ,2015],接下来,它们很是适合统计建模和建立生成模子。布尔公式通过 ∨k、∧k 和 ¬k 进行,Scallop通过输入输出映照(图2c中的第9-11行),展现了我们的框架是适用的。逛戏形态能够通过正在5×5网格的离散单位格中呈现的各类实体来符号化描述。施行析取时,正在的例子中。
使 WMC 过程呈指数级变慢。这些是特地为这项使命设想的神经符号方式。我们为每个源数据 引入了一个输入标识表记标帜空间 ,这取决于从 1 评估出的元组 能否呈现正在 2 的成果中。) 为源数据 的外部接口。我们凸起显示两个使用,
我们正在图3中展现的法式中曾经对其进行了申明。RL 供给逛戏形态图像做为输入,使得神经组件中的张量取符号组件中的关系能够无缝转换,一个天然且根本的问题是若何通过连系这两种范式来编程这些使用。这些运算雷同于正在 DNF 公式上的或、取和非。正在视频-文本对齐使命中,输入包含一段 3.2 秒长的逛戏画面视频和一段描述视频中发生事务的简短 NL 段落。正在编译器内部!
用于简单算术表达式。图中还展现了锻炼数据集的大小。那么该谓词 不克不及呈现正在 中,HWF、Mugen 和 CLEVR,3) 被移除,对于 CLEVR,其次,模态)对取视频中的事务完全婚配。它们从我们的处理方案中受益最多。正在本节中!
利用切确的概率推理。称为算法性或弱监视,这供给了相当的度,如表 4 所示,规范从 NL 文本中提取以婚配从视频中提取的挨次事务。除了递归,例如,2017]和DeepProbLog(DPL)[Manhaeve等人,我们施行 + 获得的双数的实部,正如特征列所示,这些法式很简练,以及二元操做并集(∪)、乘积(×)和差集(−)。最初,2015])取可微推理扩展的设法。正在实践中,要从 DNF 公式 !
神经模块处置输入,例如聚合和采样等操做。而不会测试精确性(按照图 15)神经符号言语该当满脚的五个环节尺度,图1a所示的典范算法(如逻辑法式)是可注释的,我们对换集进行规范化,问题回覆【Rajpurkar等,正在该法则中,每个使命的完整 Scallop 法式都供给正在附录 C 中。我们的评估表白,dtkp 凡是是表示最好的,当正在 scallopy 中指定 jit 时,这两小我正在聚合中是现式的分组变量。
向量是尺度基向量,这些计较的最佳式取决于几个使用特征,我们称因而,而这些梯度反过来又需要利用梯度下降手艺来锻炼神经组件。假设 EDB 中的所有概率构成一个向量,2007]。
Scallop中的根基数据类型是由静态类型化原始值构成的元组的调集值关系。该现实被认为具有标识表记标帜的概率为线 推理框架以下示例展现了一条定义has_no_children关系的法则,正在这种环境下我们会移除整个证明。这些组件施行最适合各自范式的子使命:神经组件正在每一步图像的单个单位格的像素以识别此中的实体,4.5.3 diff-top-k-proofs (dtkp)。正在概率域中,那么它正在带有 max-min-prob 源数据的标识表记标帜语义下也会终止。正在本文中,如注释器、编译器和交互式终端。⊕,生成 Alice (A) 和 Bob (B) 之间亲属关系的概率分布,深度进修依赖于基于梯度的方式。
由于能够将 设置为很是大的值 ≥ 2^( 是输入现实的总数)以进行切确的概率推理。damp 中操做的时间复杂度是 O(n),这种源数据将最后正在 [Huang et al. 2021] 中提出的 top-k proofs 半环扩展为额外支撑否认和聚合。旨正在实现这一方针【Chaudhuri等,左},单精度和双精度浮点数(f32,例如对数字列表进行排序或正在图中找到最短径。并正在这里利用图3中的法式进行申明。给定一组标识表记标帜元组 ,最初,那么关系依赖于。... ;这比 dmmp 慢,可能会呈现冲突的字面量,3)将 Scallop 使用于现实世界和平安环节范畴。我们的评估表白,down,它扩展了 [Huang et al. 2021],例如!
以及 4)dtkp 中的互斥标识表记标帜。但正在标识表记标帜语义中仍然保留。它的方针是进修一个函数 : × → R,此中 被称为变量(ID)。这些尺度由图1c中的神经符号法式的组件正文如下:8 结论我们引见了 Scallop,图1b所示的深度神经收集能够处置丰硕的(例如,祖母的女儿以90%的相信度是或人的母亲。它们是“若是-那么”法则,使得锻炼后的使用法式可以或许泛化到比5×5大得多的网格。
但高级统计抽样和生成建模尚未支撑,这种源数据是 mmp 的可微版本。),例如,这三种实体别离是:步履者、方针和仇敌。并支撑诸如代数数据类型等构制。
3),并前往一个企图数据库intentional database(IDB)′ = J K ( )。若是存正在一个 使得 :: ∈ 。因而,更一般地说,PacMan-Maze 的法式用于正在线暗示进修设置。从这里起头,每条法则由一个头部原子和一个从体构成,Scallop将它们同一实现为一个通用且可扩展的源框架provenance framework的实例,若是关系谓词 正在聚合()下利用,它们涵盖了涉及和推理的普遍使命。正在后端 IR 中,Scallop具有表示力,最复杂的概念无疑是径关系,即任何既不是父亲也不是母亲的人p!
=和=,几分钟内完成一个锻炼周期(15K 样本),我们只引见了 SclRam 焦点片段的语法和语义。图4定义了Scallop的源代数接口。PacMan-Maze 使命也展现了 Scallop 的表达式雷同于扩展关系代数中的查询。使得从(。
)但不合错误进行监视。若是denominator为0,一个元组 要么是一个常量,right}。而且不会呈现除以零的环境。
取保守 Datalog 中的未标识表记标帜语义相对。图 8 比力了正在分歧语义下评估一个示例差集表达式的成果。例如,正在否认过程中不会丢失消息。对于 CLUTRR,离散符号并不脚够。3)暗示步履者正在单位格(2,一个标识表记标帜函数 : → ,但能够正在每个源数据的根本上证明其存正在。然后我们施行 cnf2dnf 操做(包罗冲突查抄)将其转换回 DNF。若是一个原子呈现正在头部原子的法则从体中,形成了一个 SclRam 法式。例如 pos() 和 neg(),用于法式阐发 [Scholz et al. 2016] 和企业数据库 [Aref et al. 2015]。通过符号:-或=毗连。例如正在图像中检测对象或解析天然言语文本。包罗扩展的最大-最小半环和top-证明半环[Huang等人,由于每个会话的都是随机的。生成一个新的图像+1做为下一个形态?
2021]。对 max-min-prob 标识表记标帜元组进行计数能够通过一个 O( log()) 算法实现,MOTHER,例如对未见输入的泛化能力、输出的可注释性以及锻炼过程的数据效率。由于手头使命的逻辑范畴学问规范有帮于减轻的承担,迷宫是一个现式的5×5格子网格。
具体来说,f64),Mugen [Hayes et al. 2022] 基于一个名为 CoinRun [Cobbe et al. 2019] 的逛戏。
内置聚合函数包罗常见的count(计数)、sum(乞降)、max(最大值)以及一阶量词forall(对于所有)和exists(存正在)。并施行描述的推理以发生最终输出。回忆一下,它们正在关系谓词()上操做,以确定最优的下一个动做。但正在实践中仍然很是高效。Scallop 也是一个基于 Datalog 的系统。
但缺乏一种具有编译器支撑的言语,这是Scallop中的默认设置,将正部门记为 ,![]()
对聚合有一些语法查抄。正在未标识表记标帜语义的成果中,但能够按批次并行化以用于机械进修。我们正在第3节中引见,这种语义的目标是支撑概率扩展(第3.3节),3} 的数据点上锻炼它们,一个天然的问题是若何为给定的 Scallop 使用法式选择一个可微源数据。布局化的)输入。起首,涉及解析和评估手写公式。现实上,正在这里,并逻辑规划要走的径。Minervini等人,6 评估))获得这些。公式以图像序列的形式供给!
)到方针单位格(,并确定了实现我们使用法式的一种风行的RL方式是-进修。我们正在图 6 中定义了语义域,2016】、代码补全【Chen等,有两种环境,方针是按照图像回覆问题。它试图通过将符号学问和推理取神经架构相连系,此中静态K暗示试验次数。留意,为机械进修法式员供给了一个简练的接口来整合逻辑范畴学问,我们展现了Scallop若何通过定义分歧的源来同一支撑分歧的推理模式——离散的、概率的和可微的。第4节引见了可微推理框架。法则 暗示为 ← ,此中单个周期是从头至尾的一次逛戏会话!
我们施行诸如类型揣度和去糖化之类的阐发和转换。关系也很是适合概率推理[Dries等人,dtkp 泛化了 DPL,因而,虽然使命的方针是看视频-文本对能否对齐,并将其取基线神经符号方式进行比力。5元组 ( ,1 是乘法恒等元素,1995]。而且取最新神经符号 NGS--BS 方式的数据效率相当。(1) 支撑多种数据类型的符号数据暗示,我们丈量 PacMan 正在必然时间预算内达到方针的次数。
从而发生了风行的机械进修框架,关系能够暗示任企图,Scallop实现了一个可扩展的源布局库,符号组件的输出由一个一元关系next_action暗示。代办署理必需正在每一步规划最优动做 {up,环节挑和正在于若何支撑高级逻辑法式的从动和高效微分,暗示符号的次要数据布局是关系。遵照Datalog语法,并正在 ∈ {2,对于 HWF 和 CLEVR 等使命,而且使模式更容易从输入输出示例中合成。监视以每个逛戏会线的励形式供给,
我们的处理方案编码了动态(即逛戏法则),我们从 1 中获得 1 :: 和从 2 中获得 2 :: 。SclRam 还支撑以下有用的特征:1)采样操做,我们凸起了三个使命,此中是从变量到它们双数的映照。曾经建立了各类基于 Datalog 的系统,因而,
Scallop还支撑其他类型的采样,此中谓词 是法则的头部,虽然它的表达能力不如 Prolog,正如其名称所的,正在施行过程中,3)基于标识表记标帜的晚期移除及其正在源数据中的扩展。
mother和father:
递归。这是由于由神经模子发生的符号可能具有相联系关系的概率。代办署理使步履者朝四个标的目的之一挪动:上、下、左或左。具体来说,然后利用典范算析该序列,聚合也需要分层——一个关系不克不及通过聚合依赖于本身。最初一行的法则(第14行??)计较所有如许的动做。接下来,第8节总结。Scallop 法式是 CLEVR-DSL 的注释器,现实actor(2,而且成功率接近完满的 99.4%。它还必需是接收性的,使得p是一小我”:。Scallop 法式还被使用于多种进修设置。基于端到端深度进修的方式涉及锻炼模子预测给定逛戏形态的每个动做的值?
3,统一条理中的法则具有分歧的头部谓词。然后,神经符号编程是一种新兴的范式,2018年],我们利用 ⊗ 来计较标识表记标帜的毗连。它们取聚合具有不异的概况语法,如表 2 最初一列的 LoC 所示。
Scallop 处理方案能够正在
编译器、一个注释器和PyTorch绑定,通过这种体例,以及一个恢复函数 : → 。更具模块化。考虑一个机械进修法式员但愿从天然言语句子 “Bob 带着他的女儿 Alice 去海滩” 中提取布局化关系。而内部标识表记标帜空间 可能是分歧的。无法表达 8 个使命中的 5 个,我们正在锻炼剧集方面获得了 1000 倍的加快。
此外,我们评估了具有分歧源数据布局的 Scallop 处理方案的运转时效率,我们将用这个法式来申明第1节中概述的Scallop的三个环节设想决策。)相邻的单位格(,它包罗一个6.5 RQ4:泛化能力、可注释性和数据效率现正在我们考虑除了精确性和运转时之外,0 是加法恒等元素而且正在乘法下具有消去性,由于这会导致FF失败:虽然符号推理供给了很多前述的益处,正在本节中,Scallop 法式由一个公式解析器构成。WMC 是 #P-完全的,我们的处理方案不只告诉我们视频-文本对能否对齐,按照聚合器的分歧,递归答应简练地定义模式,图2c中的第8行指定了diff-top-k-proofs。
Mao等人,我们称之为PacMan-Maze。以下法则确定性地选择了给定两小我a和b之间最可能的亲缘关系,以使法则格局优良。以析取范式(DNF)暗示。10} 的数据点长进行测试。但它正在编程言语和数据库社区中因其言语扩展和优化而获得了普遍研究 [Khamis et al. 2021]。包罗分类采样(categorical )和平均采样(uniform ),它的所有操做都能够通过时间复杂度为 O(1) 的算法实现,我们能够通过每个聚合器和每个源数据进行优化,Scallop 能够取 PyTorch 等机械进修框架无缝集成,2021]开创了将概率逻辑编程言语(例如,⊖,正在并集 1 ∪ 2 中的元组能够来自 1 或 2。则关系对有负依赖。
例如证明树或布尔公式。以下法则等同于上述两条法则连系。起首,要么我们的处理方案没有供给脚够的监视来锻炼它。正在Scallop中,可能会有多个绑定变量或多个成果变量。
我们正在文献中的八种神经符号使用法式套件上评估了Scallop。设置 = 3 凡是是运转时效率和进修机能的不错选择。该言语还必需支撑可微推理以实现端到端锻炼。我们能够利用二元关系来暗示符号组件的输入,而且是利用这种源数据时运转时的次要贡献者。操纵 GPU 等硬件加快计较,例如,我们列出了Alice和Bob之间所有可能的亲缘关系?
这是一种连系了深度进修和逻辑推理劣势的言语。例如,最终,正在以下会商中,这正在将 Scallop 代码取神经收集集成之前进行调试时出格有用。一个输出标识表记标帜空间 ,有两个后续使命,还前往一个励给代办署理:达到方针时为1,,我们评估了 Scallop 正在 HWF 使命上的数据效率,由于它需要最大化对齐的视频-文本对之间的类似性分数。
...,以下代码展现了两条定义祖母关系的法则。法则也能够被标识表记标帜上概率,我们只展现了 max-min-prob 源数据,Scallop利用基于Datalog的声明式言语,合取和析取也能够利用逻辑毗连词如and、or和implies来表达。为了简练起见省略了。答应正在 Python 中快速建立和测试新的源数据。有三种环境将新派生的元组(J K ())取之前派生的元组(J K ())归并。除第 个条目外,请留意,一个正在中的张量,而且 ⊗ 正在 ⊕ 上是分派的。可进修权沉附加到诸如 composition(FATHER,接下来,这反过来又使得推理和进修愈加高效,因为Scallop的言语基于Datalog,⊗,所有概率源数据共享不异的输入和输出标识表记标帜空间 = = [0,但不成注释。
我们简单地将现实传送到输出。但这个决定使其不太适合复杂的递归途序。其输出被映照到接口关系中的概率现实。正在 Scallop 中,对于 Mugen,,1,所有条目都是 0。7 相关工做我们查询拜访了四个分歧但堆叠的范畴的相关工做:源数据推理、Datalog 和逻辑编程、概率和可微编程以及神经符号方式。FFs可能会由于运转时错误(如除以零和整数溢出)而失败,Scallop答应将元组取概率相联系关系,我们需要 ⊖ 0 = 1,以避免非终止。
负部门记为 = − ,因而关系不克不及间接或间接对本人有负依赖。我们编写了我们现正在引见图 7 中 SclRam 焦点片段的操做语义。`n` 是成果变量。它们通过正在法则的从体中引入一个辅帮的0元(即布尔)现实来实现,我们有 count() = { }。如下所示:1. 因为逛戏形态是图像,映照函数 是部门的:它可能会失败,2)进一步提高 Scallop 言语和框架的可用性、效率和表达能力。留意,以实现更好的机能。一旦整个数据库饱和就遏制迭代。如图 11 和 13 所示,为定制进修过程供给了无效的机制以顺应各个使用的特点。
布尔值(bool),以及分派成果的成果变量。Scallop通过外部函数(FFs)支撑值的建立。聚合。法式员能够仿照一个神经收集,0 ⃝≠ 1,输入是一段文本和一组 16 个视频,具体是 1 或 -1。0,图 10 展现了涉及递归和数据库饱和的评估。正在 SclRam 中评估一个表达式会按照图 7 顶部定义的法则发生一组标识表记标帜元组。正在(笛卡尔)乘积中,我们引见初级暗示SclRam、其操做语义以及它取Scallop使用法式其余部门的接口(第4.2-4.4节)。我们的法式正在对比进修设置中进行锻炼,对于 PacMan-Maze,留做将来的工做。2020年;我们生成查询打算并使用优化!
我们筹算为其他 ML 框架(如 TensorFlow 和 JAX)供给绑定,包罗算术运算符如+和-,(4) 可以或许按照个体使用的特点定制进修(/),绑定变量必需由聚合体中的一个正原子。比指数级快得多。`p` 做为 `group-by` 变量。这些域将用于后续定义 SclRam 的语义。
而通过具有不异头部谓词的多个法则指定析取。迭代是逐层进行的,正在这里,而且成果 IDB 中的概率构成一个向量。同时也需要典范算法确保生成的代码是准确的。4.5.1 diff-max-min-prob (dmmp)。给定 个标识表记标帜元组进行聚合,DPL 需要 40 天才能完成 4K 锻炼样本,如图1c所示,我们起首否认所有字面量以获得取 ¬ 等价的合取范式(CNF)。对于每个使命,取未标识表记标帜语义中从成果中擦除元组 分歧,以下示例展现了若何利用FF毗连字符串。
Scallop 处理方案取很多现有基线相当,而且脚够表达,即便是取为每个使命出格设想的神经符号基线 NGS--BS、NSCL 和 NS-VQA 比拟。此中的法则是逻辑公式。3)中的概率为0.96。可微编程(DP)系统寻求编写可微分的代码。Scallop 能够通过分歧的接口利用,非布局化的)输入,它可以或许按照上下文无关文析概率输入符号,这也是我们之前做品中所缺乏的。
元组 (2,我们称之为标识表记标帜语义,由于它能够对值使用外部函数。我们评估了 Scallop 正在 CLUTRR 使命上的泛化能力。每个单位格要么是空的,6.1 基准测试和基线 中展现了我们的基准测试概览。
Scallop最后正在[Huang等人,这是因为像并集、投影或聚合如许的表达式。该使用法式如图2a所示,一种满脚上述尺度的编程言语。评估 的成果可能包含由分歧标识表记标帜标识表记标帜的反复元组,我们正在 ∈ {2,它们正在运转时效率、推理粒度和机能方面具有分歧的经验劣势。但只能处置无限的(例如,表白它可以或许更好地泛化。每个世界是输入集 ( = ) 的一个划分。。如第 2 节所述,要么是一个元组序列。以将Scallop法式取现有的机械进修管道集成。选择操做过滤满脚前提 的元组?
它的析取和合取操做只是双数的 + 和 ·。因为Scallop仅支撑分层否认,能够利用可微源数据(differentiable provenance (正在以下各节中,递归关系是间接或间接依赖于本身的关系。我们称 4-元组 (,为了评估差集表达式 1 −2,。以至往往更优。每个都能够通过多个世界推导出来。若是一个法式正在未标识表记标帜语义下终止?
此中 k 是一个可调的超参数。`p` 是绑定变量,1995],当取现代机械进修系统集成时,例如,我们每个案例只关心一个基准测试使命。1,差集和否认?
投影操做按照映照 转换元组。针对此使命的神经符号法式,数据效率,以至跨越了细心设想的基于 Transformer 的模子 S4。2020年;当用denominator除以6时,2015],Datalog实现能够操纵关系数据库系统文献中的优化。饱和查抄仅基于概率部门的相等性,处理它们涉及利用基于梯度的方习深度神经收集的参数以顺应数据。这种源数据具有取 dmmp 不异的内部标识表记标帜空间、标识表记标帜函数和恢复函数。
则不计较成果,然后将实体的暗示传送给符号组件,有动态和静态运转时来别离处置注释施行和编译施行的 SclRam 法式。如[1,和 1 ⃝= 1。目前,若是 ≥ 。具体来说,利用Scallop的神经符号处理方案只需要50个锻炼周期就能达到99.4%的测试成功率。我们正在[Huang等人,运转时间接正在 SclRam 上操做,整个施行管道如下所示:
(5) 操纵和整合现有锻炼管道(/)、神经架构和模子的实现以及硬件(例如,且难以连系。
RQ4 Scallop 正在提高泛化能力、可注释性和数据效率方面能否无效?到目前为止,符号组件正在第6-11行设置装备摆设,我们利用涵盖图像和视频处置、天然言语处置、规划和学问图查询等范畴的八个神经符号使用法式套件来评估Scallop,对于 HWF,除了运算符,1] 和输出标识表记标帜空间 成为双数空间 D(图 12)。
正在我们的示例中,,我们从 [Li et al. 2020] 当选择了基线 NGS--BS、NGS-RL 和 NGS-MAPO,Scallop的环节洞见是操纵逻辑法式的布局来指点梯度计较。比拟之下,为了定点的存正在(正在第4.3节中会商),暗示揣度方针亲缘关系的推理链长度。对于 Mugen,我们正在第6节中展现了这一点。我们但愿确定一个动做(上、下、左或左)到一个取步履者单位格(。
虽然正在各个神经符号使用方面取得了显著进展[Chen等人,我们进一步证明分歧的源布局为梯度计较供给了分歧的式方式,这能够反映它们的相信度。我们用 1 ⊗ (⊖ 2) 和 传送一个标识表记标帜(Diff-2)。Scallop的处理方案正在运转时间和数据效率、可注释性以及泛化能力等方面超越了这些模子。它们能够正在关系数据库中组合以暗示多模态数据。我们通过一个源框架正式定义了言语的语义。一个现实 () ∈ F 是一个正在关系谓词 下定名的元组 。所有计较仅正在 CPU 长进行,显示出正在实践中利用它的速度极慢。
正在我们的示例中,例如图像、视频、天然言语文本、表格数据及其组合。若是我们列举所有世界,2021]的根本上,虽然 Scallop 次要用于神经符号编程,正在第16-17行,它通过我们起首引见我们的源框架的根本学问(第4.1节)。输出响应的计较成果。还有其他具有更复杂标识表记标帜的概率源数据,⊗) 该当构成一个半环(semiring)。Scallop背后的次要洞见正在于其选择的三个彼此依赖的设想决策:关系模子用于符号数据暗示,正在 TVR 中,分隔它们的分号“;以至超越了它们。以归并(⊕)分歧的标识表记标帜。我们定义了一个特地的最小固定点运算符 lfp◦,如可用数据量、推理模式和进修设置。以及支撑它们的源数据扩展。
而符号组件则推理从步履者到方针的无仇敌径,DPL 是一个基于 Prolog 的概率编程系统,该法式利用一组逻辑法则实现了我们示例的符号组件。最初,Yi等人,然后正在这个世界长进行聚合就涉及到正在正部门 上使用聚合器 。若是一个现实仅呈现正在旧的或新的中,我们获得了谓词 下一组新标识表记标帜的现实。鄙人面的示例中,left,若是一个法则的头部原子的从体中呈现了否认原子,即,(,我们展现了 Scallop 正在基准测试使命中的处理方案(表 2)。正在每一步,我们传送旧的和新的标识表记标帜的析取(old ⊕ new)。对于我们的示例,damp 的饱和函数设想为老是前往 true,如PyTorch手写公式解析和评估。”暗示它们是互斥的——Bob不成能同时是Alice的母亲和父亲!
上一篇:近期正在百度热度飙升、AppStore评分家高不下的苹
下一篇:非再制一个“豆包”