Code coverage tests

This page documents the degree to which the PARI/GP source code is tested by our public test suite, distributed with the source distribution in directory src/test/. This is measured by the gcov utility; we then process gcov output using the lcov frond-end.

We test a few variants depending on Configure flags on the pari.math.u-bordeaux.fr machine (x86_64 architecture), and agregate them in the final report:

The target is to exceed 90% coverage for all mathematical modules (given that branches depending on DEBUGLEVEL or DEBUGMEM are not covered). This script is run to produce the results below.

LCOV - code coverage report
Current view: top level - basemath - Flx.c (source / functions) Hit Total Coverage
Test: PARI/GP v2.13.0 lcov report (development 25825-edc109b529) Lines: 2132 2393 89.1 %
Date: 2020-09-21 06:08:33 Functions: 253 286 88.5 %
Legend: Lines: hit not hit

          Line data    Source code
       1             : /* Copyright (C) 2004  The PARI group.
       2             : 
       3             : This file is part of the PARI/GP package.
       4             : 
       5             : PARI/GP is free software; you can redistribute it and/or modify it under the
       6             : terms of the GNU General Public License as published by the Free Software
       7             : Foundation. It is distributed in the hope that it will be useful, but WITHOUT
       8             : ANY WARRANTY WHATSOEVER.
       9             : 
      10             : Check the License for details. You should have received a copy of it, along
      11             : with the package; see the file 'COPYING'. If not, write to the Free Software
      12             : Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA. */
      13             : 
      14             : #include "pari.h"
      15             : #include "paripriv.h"
      16             : 
      17             : /* Not so fast arithmetic with polynomials with small coefficients. */
      18             : 
      19             : static GEN
      20   583224568 : get_Flx_red(GEN T, GEN *B)
      21             : {
      22   583224568 :   if (typ(T)!=t_VEC) { *B=NULL; return T; }
      23      498161 :   *B = gel(T,1); return gel(T,2);
      24             : }
      25             : 
      26             : /***********************************************************************/
      27             : /**                                                                   **/
      28             : /**               Flx                                                 **/
      29             : /**                                                                   **/
      30             : /***********************************************************************/
      31             : /* Flx objects are defined as follows:
      32             :    Let l an ulong. An Flx is a t_VECSMALL:
      33             :    x[0] = codeword
      34             :    x[1] = evalvarn(variable number)  (signe is not stored).
      35             :    x[2] = a_0 x[3] = a_1, etc.
      36             :    With 0 <= a_i < l
      37             : 
      38             :    signe(x) is not valid. Use degpol(x)>=0 instead.
      39             : */
      40             : /***********************************************************************/
      41             : /**                                                                   **/
      42             : /**          Conversion from Flx                                      **/
      43             : /**                                                                   **/
      44             : /***********************************************************************/
      45             : 
      46             : GEN
      47    17727871 : Flx_to_ZX(GEN z)
      48             : {
      49    17727871 :   long i, l = lg(z);
      50    17727871 :   GEN x = cgetg(l,t_POL);
      51   142037573 :   for (i=2; i<l; i++) gel(x,i) = utoi(z[i]);
      52    17727512 :   x[1] = evalsigne(l-2!=0)| z[1]; return x;
      53             : }
      54             : 
      55             : GEN
      56       31388 : Flx_to_FlxX(GEN z, long sv)
      57             : {
      58       31388 :   long i, l = lg(z);
      59       31388 :   GEN x = cgetg(l,t_POL);
      60      111643 :   for (i=2; i<l; i++) gel(x,i) = Fl_to_Flx(z[i], sv);
      61       31388 :   x[1] = evalsigne(l-2!=0)| z[1]; return x;
      62             : }
      63             : 
      64             : /* same as Flx_to_ZX, in place */
      65             : GEN
      66    16772324 : Flx_to_ZX_inplace(GEN z)
      67             : {
      68    16772324 :   long i, l = lg(z);
      69   136333569 :   for (i=2; i<l; i++) gel(z,i) = utoi(z[i]);
      70    16771625 :   settyp(z, t_POL); z[1]=evalsigne(l-2!=0)|z[1]; return z;
      71             : }
      72             : 
      73             : /*Flx_to_Flv=zx_to_zv*/
      74             : GEN
      75    28819071 : Flx_to_Flv(GEN x, long N)
      76             : {
      77             :   long i, l;
      78    28819071 :   GEN z = cgetg(N+1,t_VECSMALL);
      79    28815543 :   if (typ(x) != t_VECSMALL) pari_err_TYPE("Flx_to_Flv",x);
      80    28815591 :   l = lg(x)-1; x++;
      81   402442735 :   for (i=1; i<l ; i++) z[i]=x[i];
      82   197675928 :   for (   ; i<=N; i++) z[i]=0;
      83    28815591 :   return z;
      84             : }
      85             : 
      86             : /*Flv_to_Flx=zv_to_zx*/
      87             : GEN
      88    12552014 : Flv_to_Flx(GEN x, long sv)
      89             : {
      90    12552014 :   long i, l=lg(x)+1;
      91    12552014 :   GEN z = cgetg(l,t_VECSMALL); z[1]=sv;
      92    12548802 :   x--;
      93   158715882 :   for (i=2; i<l ; i++) z[i]=x[i];
      94    12548802 :   return Flx_renormalize(z,l);
      95             : }
      96             : 
      97             : /*Flm_to_FlxV=zm_to_zxV*/
      98             : GEN
      99        2226 : Flm_to_FlxV(GEN x, long sv)
     100        6027 : { pari_APPLY_type(t_VEC, Flv_to_Flx(gel(x,i), sv)) }
     101             : 
     102             : /*FlxC_to_ZXC=zxC_to_ZXC*/
     103             : GEN
     104       27002 : FlxC_to_ZXC(GEN x)
     105      116637 : { pari_APPLY_type(t_COL, Flx_to_ZX(gel(x,i))) }
     106             : 
     107             : /*FlxC_to_ZXC=zxV_to_ZXV*/
     108             : GEN
     109      168508 : FlxV_to_ZXV(GEN x)
     110      954544 : { pari_APPLY_type(t_VEC, Flx_to_ZX(gel(x,i))) }
     111             : 
     112             : void
     113      876865 : FlxV_to_ZXV_inplace(GEN v)
     114             : {
     115             :   long i;
     116     2472795 :   for(i=1;i<lg(v);i++) gel(v,i)= Flx_to_ZX(gel(v,i));
     117      876778 : }
     118             : 
     119             : /*FlxM_to_ZXM=zxM_to_ZXM*/
     120             : GEN
     121        4123 : FlxM_to_ZXM(GEN x)
     122       14290 : { pari_APPLY_same(FlxC_to_ZXC(gel(x,i))) }
     123             : 
     124             : GEN
     125      383182 : FlxV_to_FlxX(GEN x, long v)
     126             : {
     127      383182 :   long i, l = lg(x)+1;
     128      383182 :   GEN z = cgetg(l,t_POL); z[1] = evalvarn(v);
     129      383182 :   x--;
     130     5186588 :   for (i=2; i<l ; i++) gel(z,i) = gel(x,i);
     131      383182 :   return FlxX_renormalize(z,l);
     132             : }
     133             : 
     134             : GEN
     135           0 : FlxM_Flx_add_shallow(GEN x, GEN y, ulong p)
     136             : {
     137           0 :   long l = lg(x), i, j;
     138           0 :   GEN z = cgetg(l,t_MAT);
     139             : 
     140           0 :   if (l==1) return z;
     141           0 :   if (l != lgcols(x)) pari_err_OP( "+", x, y);
     142           0 :   for (i=1; i<l; i++)
     143             :   {
     144           0 :     GEN zi = cgetg(l,t_COL), xi = gel(x,i);
     145           0 :     gel(z,i) = zi;
     146           0 :     for (j=1; j<l; j++) gel(zi,j) = gel(xi,j);
     147           0 :     gel(zi,i) = Flx_add(gel(zi,i), y, p);
     148             :   }
     149           0 :   return z;
     150             : }
     151             : 
     152             : /***********************************************************************/
     153             : /**                                                                   **/
     154             : /**          Conversion to Flx                                        **/
     155             : /**                                                                   **/
     156             : /***********************************************************************/
     157             : /* Take an integer and return a scalar polynomial mod p,  with evalvarn=vs */
     158             : GEN
     159     9981792 : Fl_to_Flx(ulong x, long sv)
     160             : {
     161     9981792 :   return x? mkvecsmall2(sv, x): pol0_Flx(sv);
     162             : }
     163             : 
     164             : /* a X^d */
     165             : GEN
     166      321150 : monomial_Flx(ulong a, long d, long vs)
     167             : {
     168             :   GEN P;
     169      321150 :   if (a==0) return pol0_Flx(vs);
     170      321150 :   P = const_vecsmall(d+2, 0);
     171      321163 :   P[1] = vs; P[d+2] = a;
     172      321163 :   return P;
     173             : }
     174             : 
     175             : GEN
     176     1069681 : Z_to_Flx(GEN x, ulong p, long sv)
     177             : {
     178     1069681 :   long u = umodiu(x,p);
     179     1069695 :   return u? mkvecsmall2(sv, u): pol0_Flx(sv);
     180             : }
     181             : 
     182             : /* return x[0 .. dx] mod p as t_VECSMALL. Assume x a t_POL*/
     183             : GEN
     184    76151181 : ZX_to_Flx(GEN x, ulong p)
     185             : {
     186    76151181 :   long i, lx = lg(x);
     187    76151181 :   GEN a = cgetg(lx, t_VECSMALL);
     188    76148959 :   a[1]=((ulong)x[1])&VARNBITS;
     189   580111785 :   for (i=2; i<lx; i++) a[i] = umodiu(gel(x,i), p);
     190    76150802 :   return Flx_renormalize(a,lx);
     191             : }
     192             : 
     193             : /* return x[0 .. dx] mod p as t_VECSMALL. Assume x a t_POL*/
     194             : GEN
     195     3744293 : zx_to_Flx(GEN x, ulong p)
     196             : {
     197     3744293 :   long i, lx = lg(x);
     198     3744293 :   GEN a = cgetg(lx, t_VECSMALL);
     199     3744293 :   a[1] = x[1];
     200    11149686 :   for (i=2; i<lx; i++) uel(a,i) = umodsu(x[i], p);
     201     3744293 :   return Flx_renormalize(a,lx);
     202             : }
     203             : 
     204             : ulong
     205    48636104 : Rg_to_Fl(GEN x, ulong p)
     206             : {
     207    48636104 :   switch(typ(x))
     208             :   {
     209    25034744 :     case t_INT: return umodiu(x, p);
     210       61381 :     case t_FRAC: {
     211       61381 :       ulong z = umodiu(gel(x,1), p);
     212       61381 :       if (!z) return 0;
     213       58210 :       return Fl_div(z, umodiu(gel(x,2), p), p);
     214             :     }
     215          49 :     case t_PADIC: return padic_to_Fl(x, p);
     216    23539941 :     case t_INTMOD: {
     217    23539941 :       GEN q = gel(x,1), a = gel(x,2);
     218    23539941 :       if (absequaliu(q, p)) return itou(a);
     219           0 :       if (!dvdiu(q,p)) pari_err_MODULUS("Rg_to_Fl", q, utoi(p));
     220           0 :       return umodiu(a, p);
     221             :     }
     222           0 :     default: pari_err_TYPE("Rg_to_Fl",x);
     223             :       return 0; /* LCOV_EXCL_LINE */
     224             :   }
     225             : }
     226             : 
     227             : ulong
     228     1104200 : Rg_to_F2(GEN x)
     229             : {
     230     1104200 :   switch(typ(x))
     231             :   {
     232      261757 :     case t_INT: return mpodd(x);
     233           0 :     case t_FRAC:
     234           0 :       if (!mpodd(gel(x,2))) (void)Fl_inv(0,2); /* error */
     235           0 :       return mpodd(gel(x,1));
     236           0 :     case t_PADIC:
     237           0 :       if (!absequaliu(gel(x,2),2)) pari_err_OP("",x, mkintmodu(1,2));
     238           0 :       if (valp(x) < 0) (void)Fl_inv(0,2);
     239           0 :       return valp(x) & 1;
     240      842443 :     case t_INTMOD: {
     241      842443 :       GEN q = gel(x,1), a = gel(x,2);
     242      842443 :       if (mpodd(q)) pari_err_MODULUS("Rg_to_F2", q, gen_2);
     243      842443 :       return mpodd(a);
     244             :     }
     245           0 :     default: pari_err_TYPE("Rg_to_F2",x);
     246             :       return 0; /* LCOV_EXCL_LINE */
     247             :   }
     248             : }
     249             : 
     250             : GEN
     251     2005574 : RgX_to_Flx(GEN x, ulong p)
     252             : {
     253     2005574 :   long i, lx = lg(x);
     254     2005574 :   GEN a = cgetg(lx, t_VECSMALL);
     255     2005574 :   a[1]=((ulong)x[1])&VARNBITS;
     256    17228707 :   for (i=2; i<lx; i++) a[i] = Rg_to_Fl(gel(x,i), p);
     257     2005574 :   return Flx_renormalize(a,lx);
     258             : }
     259             : 
     260             : GEN
     261           0 : RgXV_to_FlxV(GEN x, ulong p)
     262           0 : { pari_APPLY_type(t_VEC, RgX_to_Flx(gel(x,i), p)) }
     263             : 
     264             : /* If x is a POLMOD, assume modulus is a multiple of T. */
     265             : GEN
     266     2160784 : Rg_to_Flxq(GEN x, GEN T, ulong p)
     267             : {
     268     2160784 :   long ta, tx = typ(x), v = get_Flx_var(T);
     269             :   GEN a, b;
     270     2160784 :   if (is_const_t(tx))
     271             :   {
     272     2072035 :     if (tx == t_FFELT) return FF_to_Flxq(x);
     273     1345811 :     return Fl_to_Flx(Rg_to_Fl(x, p), v);
     274             :   }
     275       88750 :   switch(tx)
     276             :   {
     277        8576 :     case t_POLMOD:
     278        8576 :       b = gel(x,1);
     279        8576 :       a = gel(x,2); ta = typ(a);
     280        8576 :       if (is_const_t(ta)) return Fl_to_Flx(Rg_to_Fl(a, p), v);
     281        8422 :       b = RgX_to_Flx(b, p); if (b[1] != v) break;
     282        8422 :       a = RgX_to_Flx(a, p); if (Flx_equal(b,T)) return a;
     283           0 :       if (lgpol(Flx_rem(b,T,p))==0) return Flx_rem(a, T, p);
     284           0 :       break;
     285       80174 :     case t_POL:
     286       80174 :       x = RgX_to_Flx(x,p);
     287       80174 :       if (x[1] != v) break;
     288       80174 :       return Flx_rem(x, T, p);
     289           0 :     case t_RFRAC:
     290           0 :       a = Rg_to_Flxq(gel(x,1), T,p);
     291           0 :       b = Rg_to_Flxq(gel(x,2), T,p);
     292           0 :       return Flxq_div(a,b, T,p);
     293             :   }
     294           0 :   pari_err_TYPE("Rg_to_Flxq",x);
     295             :   return NULL; /* LCOV_EXCL_LINE */
     296             : }
     297             : 
     298             : /***********************************************************************/
     299             : /**                                                                   **/
     300             : /**          Basic operation on Flx                                   **/
     301             : /**                                                                   **/
     302             : /***********************************************************************/
     303             : /* = zx_renormalize. Similar to normalizepol, in place */
     304             : GEN
     305  1337765279 : Flx_renormalize(GEN /*in place*/ x, long lx)
     306             : {
     307             :   long i;
     308  1566348771 :   for (i = lx-1; i>1; i--)
     309  1501989527 :     if (x[i]) break;
     310  1337765279 :   stackdummy((pari_sp)(x + lg(x)), (pari_sp)(x + i+1));
     311  1337795019 :   setlg(x, i+1); return x;
     312             : }
     313             : 
     314             : GEN
     315      422802 : Flx_red(GEN z, ulong p)
     316             : {
     317      422802 :   long i, l = lg(z);
     318      422802 :   GEN x = cgetg(l, t_VECSMALL);
     319      422779 :   x[1] = z[1];
     320    28827218 :   for (i=2; i<l; i++) x[i] = uel(z,i)%p;
     321      422779 :   return Flx_renormalize(x,l);
     322             : }
     323             : 
     324             : int
     325    24193685 : Flx_equal(GEN V, GEN W)
     326             : {
     327    24193685 :   long l = lg(V);
     328    24193685 :   if (lg(W) != l) return 0;
     329    24389766 :   while (--l > 1) /* do not compare variables, V[1] */
     330    23870504 :     if (V[l] != W[l]) return 0;
     331      519262 :   return 1;
     332             : }
     333             : 
     334             : GEN
     335     1395218 : random_Flx(long d1, long vs, ulong p)
     336             : {
     337     1395218 :   long i, d = d1+2;
     338     1395218 :   GEN y = cgetg(d,t_VECSMALL); y[1] = vs;
     339    11531335 :   for (i=2; i<d; i++) y[i] = random_Fl(p);
     340     1395430 :   return Flx_renormalize(y,d);
     341             : }
     342             : 
     343             : static GEN
     344     4591126 : Flx_addspec(GEN x, GEN y, ulong p, long lx, long ly)
     345             : {
     346             :   long i,lz;
     347             :   GEN z;
     348             : 
     349     4591126 :   if (ly>lx) swapspec(x,y, lx,ly);
     350     4591126 :   lz = lx+2; z = cgetg(lz, t_VECSMALL);
     351    86003478 :   for (i=0; i<ly; i++) z[i+2] = Fl_add(x[i], y[i], p);
     352    73146092 :   for (   ; i<lx; i++) z[i+2] = x[i];
     353     4591126 :   z[1] = 0; return Flx_renormalize(z, lz);
     354             : }
     355             : 
     356             : GEN
     357    38175643 : Flx_add(GEN x, GEN y, ulong p)
     358             : {
     359             :   long i,lz;
     360             :   GEN z;
     361    38175643 :   long lx=lg(x);
     362    38175643 :   long ly=lg(y);
     363    38175643 :   if (ly>lx) swapspec(x,y, lx,ly);
     364    38175643 :   lz = lx; z = cgetg(lz, t_VECSMALL); z[1]=x[1];
     365   370195513 :   for (i=2; i<ly; i++) z[i] = Fl_add(x[i], y[i], p);
     366    75804834 :   for (   ; i<lx; i++) z[i] = x[i];
     367    38142126 :   return Flx_renormalize(z, lz);
     368             : }
     369             : 
     370             : GEN
     371     7785370 : Flx_Fl_add(GEN y, ulong x, ulong p)
     372             : {
     373             :   GEN z;
     374             :   long lz, i;
     375     7785370 :   if (!lgpol(y))
     376      227083 :     return Fl_to_Flx(x,y[1]);
     377     7560298 :   lz=lg(y);
     378     7560298 :   z=cgetg(lz,t_VECSMALL);
     379     7559167 :   z[1]=y[1];
     380     7559167 :   z[2] = Fl_add(y[2],x,p);
     381    40784104 :   for(i=3;i<lz;i++)
     382    33225026 :     z[i] = y[i];
     383     7559078 :   if (lz==3) z = Flx_renormalize(z,lz);
     384     7558822 :   return z;
     385             : }
     386             : 
     387             : static GEN
     388      740248 : Flx_subspec(GEN x, GEN y, ulong p, long lx, long ly)
     389             : {
     390             :   long i,lz;
     391             :   GEN z;
     392             : 
     393      740248 :   if (ly <= lx)
     394             :   {
     395      740264 :     lz = lx+2; z = cgetg(lz, t_VECSMALL);
     396    44448268 :     for (i=0; i<ly; i++) z[i+2] = Fl_sub(x[i],y[i],p);
     397     2263305 :     for (   ; i<lx; i++) z[i+2] = x[i];
     398             :   }
     399             :   else
     400             :   {
     401           0 :     lz = ly+2; z = cgetg(lz, t_VECSMALL);
     402           0 :     for (i=0; i<lx; i++) z[i+2] = Fl_sub(x[i],y[i],p);
     403           0 :     for (   ; i<ly; i++) z[i+2] = Fl_neg(y[i],p);
     404             :   }
     405      740058 :   z[1] = 0; return Flx_renormalize(z, lz);
     406             : }
     407             : 
     408             : GEN
     409    83593069 : Flx_sub(GEN x, GEN y, ulong p)
     410             : {
     411    83593069 :   long i,lz,lx = lg(x), ly = lg(y);
     412             :   GEN z;
     413             : 
     414    83593069 :   if (ly <= lx)
     415             :   {
     416    50324595 :     lz = lx; z = cgetg(lz, t_VECSMALL);
     417   297995254 :     for (i=2; i<ly; i++) z[i] = Fl_sub(x[i],y[i],p);
     418   100022747 :     for (   ; i<lx; i++) z[i] = x[i];
     419             :   }
     420             :   else
     421             :   {
     422    33268474 :     lz = ly; z = cgetg(lz, t_VECSMALL);
     423   254243949 :     for (i=2; i<lx; i++) z[i] = Fl_sub(x[i],y[i],p);
     424   156151182 :     for (   ; i<ly; i++) z[i] = y[i]? (long)(p - y[i]): y[i];
     425             :   }
     426    83584457 :   z[1]=x[1]; return Flx_renormalize(z, lz);
     427             : }
     428             : 
     429             : GEN
     430       29114 : Flx_Fl_sub(GEN y, ulong x, ulong p)
     431             : {
     432             :   GEN z;
     433       29114 :   long lz = lg(y), i;
     434       29114 :   if (lz==2)
     435          72 :     return Fl_to_Flx(Fl_neg(x, p),y[1]);
     436       29042 :   z = cgetg(lz, t_VECSMALL);
     437       29042 :   z[1] = y[1];
     438       29042 :   z[2] = Fl_sub(uel(y,2), x, p);
     439      228114 :   for(i=3; i<lz; i++)
     440      199072 :     z[i] = y[i];
     441       29042 :   if (lz==3) z = Flx_renormalize(z,lz);
     442       29042 :   return z;
     443             : }
     444             : 
     445             : static GEN
     446     1841046 : Flx_negspec(GEN x, ulong p, long l)
     447             : {
     448             :   long i;
     449     1841046 :   GEN z = cgetg(l+2, t_VECSMALL) + 2;
     450    11752923 :   for (i=0; i<l; i++) z[i] = Fl_neg(x[i], p);
     451     1841174 :   return z-2;
     452             : }
     453             : 
     454             : GEN
     455     1841109 : Flx_neg(GEN x, ulong p)
     456             : {
     457     1841109 :   GEN z = Flx_negspec(x+2, p, lgpol(x));
     458     1841453 :   z[1] = x[1];
     459     1841453 :   return z;
     460             : }
     461             : 
     462             : GEN
     463     1120153 : Flx_neg_inplace(GEN x, ulong p)
     464             : {
     465     1120153 :   long i, l = lg(x);
     466    42556122 :   for (i=2; i<l; i++)
     467    41435969 :     if (x[i]) x[i] = p - x[i];
     468     1120153 :   return x;
     469             : }
     470             : 
     471             : GEN
     472     1819297 : Flx_double(GEN y, ulong p)
     473             : {
     474             :   long i, l;
     475     1819297 :   GEN z = cgetg_copy(y, &l); z[1] = y[1];
     476    15605586 :   for(i=2; i<l; i++) z[i] = Fl_double(y[i], p);
     477     1819297 :   return Flx_renormalize(z, l);
     478             : }
     479             : GEN
     480      645864 : Flx_triple(GEN y, ulong p)
     481             : {
     482             :   long i, l;
     483      645864 :   GEN z = cgetg_copy(y, &l); z[1] = y[1];
     484     5681300 :   for(i=2; i<l; i++) z[i] = Fl_triple(y[i], p);
     485      645864 :   return Flx_renormalize(z, l);
     486             : }
     487             : GEN
     488    10458461 : Flx_Fl_mul(GEN y, ulong x, ulong p)
     489             : {
     490             :   GEN z;
     491             :   long i, l;
     492    10458461 :   if (!x) return pol0_Flx(y[1]);
     493     9754241 :   z = cgetg_copy(y, &l); z[1] = y[1];
     494     9753528 :   if (HIGHWORD(x | p))
     495     5463443 :     for(i=2; i<l; i++) z[i] = Fl_mul(y[i], x, p);
     496             :   else
     497    52464359 :     for(i=2; i<l; i++) z[i] = (y[i] * x) % p;
     498     9753656 :   return Flx_renormalize(z, l);
     499             : }
     500             : GEN
     501     7154166 : Flx_Fl_mul_to_monic(GEN y, ulong x, ulong p)
     502             : {
     503             :   GEN z;
     504             :   long i, l;
     505     7154166 :   z = cgetg_copy(y, &l); z[1] = y[1];
     506     7149712 :   if (HIGHWORD(x | p))
     507     4639959 :     for(i=2; i<l-1; i++) z[i] = Fl_mul(y[i], x, p);
     508             :   else
     509    14230562 :     for(i=2; i<l-1; i++) z[i] = (y[i] * x) % p;
     510     7149704 :   z[l-1] = 1; return z;
     511             : }
     512             : 
     513             : /* Return a*x^n if n>=0 and a\x^(-n) if n<0 */
     514             : GEN
     515     8767165 : Flx_shift(GEN a, long n)
     516             : {
     517     8767165 :   long i, l = lg(a);
     518             :   GEN  b;
     519     8767165 :   if (l==2 || !n) return Flx_copy(a);
     520     8729923 :   if (l+n<=2) return pol0_Flx(a[1]);
     521     8718757 :   b = cgetg(l+n, t_VECSMALL);
     522     8716129 :   b[1] = a[1];
     523     8716129 :   if (n < 0)
     524    35081534 :     for (i=2-n; i<l; i++) b[i+n] = a[i];
     525             :   else
     526             :   {
     527    15686161 :     for (i=0; i<n; i++) b[2+i] = 0;
     528    62650296 :     for (i=2; i<l; i++) b[i+n] = a[i];
     529             :   }
     530     8716129 :   return b;
     531             : }
     532             : 
     533             : GEN
     534    40260676 : Flx_normalize(GEN z, ulong p)
     535             : {
     536    40260676 :   long l = lg(z)-1;
     537    40260676 :   ulong p1 = z[l]; /* leading term */
     538    40260676 :   if (p1 == 1) return z;
     539     7138796 :   return Flx_Fl_mul_to_monic(z, Fl_inv(p1,p), p);
     540             : }
     541             : 
     542             : /* return (x * X^d) + y. Assume d > 0, shallow if x == 0*/
     543             : static GEN
     544     2378782 : Flx_addshift(GEN x, GEN y, ulong p, long d)
     545             : {
     546     2378782 :   GEN xd,yd,zd = (GEN)avma;
     547     2378782 :   long a,lz,ny = lgpol(y), nx = lgpol(x);
     548     2378782 :   long vs = x[1];
     549     2378782 :   if (nx == 0) return y;
     550     2376930 :   x += 2; y += 2; a = ny-d;
     551     2376930 :   if (a <= 0)
     552             :   {
     553       81924 :     lz = (a>nx)? ny+2: nx+d+2;
     554       81924 :     (void)new_chunk(lz); xd = x+nx; yd = y+ny;
     555     1666562 :     while (xd > x) *--zd = *--xd;
     556       81924 :     x = zd + a;
     557      152815 :     while (zd > x) *--zd = 0;
     558             :   }
     559             :   else
     560             :   {
     561     2295006 :     xd = new_chunk(d); yd = y+d;
     562     2295006 :     x = Flx_addspec(x,yd,p, nx,a);
     563     2295006 :     lz = (a>nx)? ny+2: lg(x)+d;
     564   108702955 :     x += 2; while (xd > x) *--zd = *--xd;
     565             :   }
     566    48925512 :   while (yd > y) *--zd = *--yd;
     567     2376930 :   *--zd = vs;
     568     2376930 :   *--zd = evaltyp(t_VECSMALL) | evallg(lz); return zd;
     569             : }
     570             : 
     571             : /* shift polynomial + gerepile */
     572             : /* Do not set evalvarn*/
     573             : static GEN
     574   431902667 : Flx_shiftip(pari_sp av, GEN x, long v)
     575             : {
     576   431902667 :   long i, lx = lg(x), ly;
     577             :   GEN y;
     578   431902667 :   if (!v || lx==2) return gerepileuptoleaf(av, x);
     579   106140067 :   ly = lx + v; /* result length */
     580   106140067 :   (void)new_chunk(ly); /* check that result fits */
     581   106084683 :   x += lx; y = (GEN)av;
     582   882818140 :   for (i = 2; i<lx; i++) *--y = *--x;
     583   465397516 :   for (i = 0; i< v; i++) *--y = 0;
     584   106084683 :   y -= 2; y[0] = evaltyp(t_VECSMALL) | evallg(ly);
     585   106244024 :   return gc_const((pari_sp)y, y);
     586             : }
     587             : 
     588             : static long
     589  1446835912 : get_Fl_threshold(ulong p, long mul, long mul2)
     590             : {
     591  1446835912 :   return SMALL_ULONG(p) ? mul: mul2;
     592             : }
     593             : 
     594             : #define BITS_IN_QUARTULONG (BITS_IN_HALFULONG >> 1)
     595             : #define QUARTMASK ((1UL<<BITS_IN_QUARTULONG)-1UL)
     596             : #define LLQUARTWORD(x) ((x) & QUARTMASK)
     597             : #define HLQUARTWORD(x) (((x) >> BITS_IN_QUARTULONG) & QUARTMASK)
     598             : #define LHQUARTWORD(x) (((x) >> (2*BITS_IN_QUARTULONG)) & QUARTMASK)
     599             : #define HHQUARTWORD(x) (((x) >> (3*BITS_IN_QUARTULONG)) & QUARTMASK)
     600             : INLINE long
     601     5634048 : maxbitcoeffpol(ulong p, long n)
     602             : {
     603     5634048 :   GEN z = muliu(sqru(p - 1), n);
     604     5628757 :   long b = expi(z) + 1;
     605             :   /* only do expensive bit-packing if it saves at least 1 limb */
     606     5632525 :   if (b <= BITS_IN_QUARTULONG)
     607             :   {
     608      691638 :     if (nbits2nlong(n*b) == (n + 3)>>2)
     609       51932 :       b = BITS_IN_QUARTULONG;
     610             :   }
     611     4940887 :   else if (b <= BITS_IN_HALFULONG)
     612             :   {
     613     1214326 :     if (nbits2nlong(n*b) == (n + 1)>>1)
     614        5455 :       b = BITS_IN_HALFULONG;
     615             :   }
     616             :   else
     617             :   {
     618     3726561 :     long l = lgefint(z) - 2;
     619     3726561 :     if (nbits2nlong(n*b) == n*l)
     620      287345 :       b = l*BITS_IN_LONG;
     621             :   }
     622     5632560 :   return b;
     623             : }
     624             : 
     625             : INLINE ulong
     626  2599313764 : Flx_mullimb_ok(GEN x, GEN y, ulong p, long a, long b)
     627             : { /* Assume OK_ULONG*/
     628  2599313764 :   ulong p1 = 0;
     629             :   long i;
     630 12133027672 :   for (i=a; i<b; i++)
     631  9533713908 :     if (y[i])
     632             :     {
     633  7921354295 :       p1 += y[i] * x[-i];
     634  7921354295 :       if (p1 & HIGHBIT) p1 %= p;
     635             :     }
     636  2599313764 :   return p1 % p;
     637             : }
     638             : 
     639             : INLINE ulong
     640   934094629 : Flx_mullimb(GEN x, GEN y, ulong p, ulong pi, long a, long b)
     641             : {
     642   934094629 :   ulong p1 = 0;
     643             :   long i;
     644  2920508268 :   for (i=a; i<b; i++)
     645  1986989453 :     if (y[i])
     646  1949197464 :       p1 = Fl_addmul_pre(p1, y[i], x[-i], p, pi);
     647   933518815 :   return p1;
     648             : }
     649             : 
     650             : /* assume nx >= ny > 0 */
     651             : static GEN
     652   227838826 : Flx_mulspec_basecase(GEN x, GEN y, ulong p, long nx, long ny)
     653             : {
     654             :   long i,lz,nz;
     655             :   GEN z;
     656             : 
     657   227838826 :   lz = nx+ny+1; nz = lz-2;
     658   227838826 :   z = cgetg(lz, t_VECSMALL) + 2; /* x:y:z [i] = term of degree i */
     659   227546814 :   if (SMALL_ULONG(p))
     660             :   {
     661   828746233 :     for (i=0; i<ny; i++)z[i] = Flx_mullimb_ok(x+i,y,p,0,i+1);
     662   571490721 :     for (  ; i<nx; i++) z[i] = Flx_mullimb_ok(x+i,y,p,0,ny);
     663   657703457 :     for (  ; i<nz; i++) z[i] = Flx_mullimb_ok(x+i,y,p,i-nx+1,ny);
     664             :   }
     665             :   else
     666             :   {
     667    55280295 :     ulong pi = get_Fl_red(p);
     668   200951798 :     for (i=0; i<ny; i++)z[i] = Flx_mullimb(x+i,y,p,pi,0,i+1);
     669   151617554 :     for (  ; i<nx; i++) z[i] = Flx_mullimb(x+i,y,p,pi,0,ny);
     670   146020828 :     for (  ; i<nz; i++) z[i] = Flx_mullimb(x+i,y,p,pi,i-nx+1,ny);
     671             :   }
     672   227577309 :   z -= 2; return Flx_renormalize(z, lz);
     673             : }
     674             : 
     675             : static GEN
     676       12118 : int_to_Flx(GEN z, ulong p)
     677             : {
     678       12118 :   long i, l = lgefint(z);
     679       12118 :   GEN x = cgetg(l, t_VECSMALL);
     680     1010667 :   for (i=2; i<l; i++) x[i] = uel(z,i)%p;
     681       12112 :   return Flx_renormalize(x, l);
     682             : }
     683             : 
     684             : INLINE GEN
     685        9841 : Flx_mulspec_mulii(GEN a, GEN b, ulong p, long na, long nb)
     686             : {
     687        9841 :   GEN z=muliispec(a,b,na,nb);
     688        9857 :   return int_to_Flx(z,p);
     689             : }
     690             : 
     691             : static GEN
     692      558600 : Flx_to_int_halfspec(GEN a, long na)
     693             : {
     694             :   long j;
     695      558600 :   long n = (na+1)>>1UL;
     696      558600 :   GEN V = cgetipos(2+n);
     697             :   GEN w;
     698     1455818 :   for (w = int_LSW(V), j=0; j+1<na; j+=2, w=int_nextW(w))
     699      897218 :     *w = a[j]|(a[j+1]<<BITS_IN_HALFULONG);
     700      558600 :   if (j<na)
     701      410821 :     *w = a[j];
     702      558600 :   return V;
     703             : }
     704             : 
     705             : static GEN
     706      677765 : int_to_Flx_half(GEN z, ulong p)
     707             : {
     708             :   long i;
     709      677765 :   long lx = (lgefint(z)-2)*2+2;
     710      677765 :   GEN w, x = cgetg(lx, t_VECSMALL);
     711     2176753 :   for (w = int_LSW(z), i=2; i<lx; i+=2, w=int_nextW(w))
     712             :   {
     713     1498988 :     x[i]   = LOWWORD((ulong)*w)%p;
     714     1498988 :     x[i+1] = HIGHWORD((ulong)*w)%p;
     715             :   }
     716      677765 :   return Flx_renormalize(x, lx);
     717             : }
     718             : 
     719             : static GEN
     720        5319 : Flx_mulspec_halfmulii(GEN a, GEN b, ulong p, long na, long nb)
     721             : {
     722        5319 :   GEN A = Flx_to_int_halfspec(a,na);
     723        5319 :   GEN B = Flx_to_int_halfspec(b,nb);
     724        5319 :   GEN z = mulii(A,B);
     725        5319 :   return int_to_Flx_half(z,p);
     726             : }
     727             : 
     728             : static GEN
     729       96763 : Flx_to_int_quartspec(GEN a, long na)
     730             : {
     731             :   long j;
     732       96763 :   long n = (na+3)>>2UL;
     733       96763 :   GEN V = cgetipos(2+n);
     734             :   GEN w;
     735     2993299 :   for (w = int_LSW(V), j=0; j+3<na; j+=4, w=int_nextW(w))
     736     2896536 :     *w = a[j]|(a[j+1]<<BITS_IN_QUARTULONG)|(a[j+2]<<(2*BITS_IN_QUARTULONG))|(a[j+3]<<(3*BITS_IN_QUARTULONG));
     737       96763 :   switch (na-j)
     738             :   {
     739       33993 :   case 3:
     740       33993 :     *w = a[j]|(a[j+1]<<BITS_IN_QUARTULONG)|(a[j+2]<<(2*BITS_IN_QUARTULONG));
     741       33993 :     break;
     742       23572 :   case 2:
     743       23572 :     *w = a[j]|(a[j+1]<<BITS_IN_QUARTULONG);
     744       23572 :     break;
     745       16892 :   case 1:
     746       16892 :     *w = a[j];
     747       16892 :     break;
     748       22306 :   case 0:
     749       22306 :     break;
     750             :   }
     751       96763 :   return V;
     752             : }
     753             : 
     754             : static GEN
     755       51932 : int_to_Flx_quart(GEN z, ulong p)
     756             : {
     757             :   long i;
     758       51932 :   long lx = (lgefint(z)-2)*4+2;
     759       51932 :   GEN w, x = cgetg(lx, t_VECSMALL);
     760     3382815 :   for (w = int_LSW(z), i=2; i<lx; i+=4, w=int_nextW(w))
     761             :   {
     762     3330883 :     x[i]   = LLQUARTWORD((ulong)*w)%p;
     763     3330883 :     x[i+1] = HLQUARTWORD((ulong)*w)%p;
     764     3330883 :     x[i+2] = LHQUARTWORD((ulong)*w)%p;
     765     3330883 :     x[i+3] = HHQUARTWORD((ulong)*w)%p;
     766             :   }
     767       51932 :   return Flx_renormalize(x, lx);
     768             : }
     769             : 
     770             : static GEN
     771       44831 : Flx_mulspec_quartmulii(GEN a, GEN b, ulong p, long na, long nb)
     772             : {
     773       44831 :   GEN A = Flx_to_int_quartspec(a,na);
     774       44831 :   GEN B = Flx_to_int_quartspec(b,nb);
     775       44831 :   GEN z = mulii(A,B);
     776       44831 :   return int_to_Flx_quart(z,p);
     777             : }
     778             : 
     779             : /*Eval x in 2^(k*BIL) in linear time, k==2 or 3*/
     780             : static GEN
     781      543144 : Flx_eval2BILspec(GEN x, long k, long l)
     782             : {
     783      543144 :   long i, lz = k*l, ki;
     784      543144 :   GEN pz = cgetipos(2+lz);
     785    15052044 :   for (i=0; i < lz; i++)
     786    14508900 :     *int_W(pz,i) = 0UL;
     787     7797594 :   for (i=0, ki=0; i<l; i++, ki+=k)
     788     7254450 :     *int_W(pz,ki) = x[i];
     789      543144 :   return int_normalize(pz,0);
     790             : }
     791             : 
     792             : static GEN
     793      278168 : Z_mod2BIL_Flx_2(GEN x, long d, ulong p)
     794             : {
     795      278168 :   long i, offset, lm = lgefint(x)-2, l = d+3;
     796      278168 :   ulong pi = get_Fl_red(p);
     797      278168 :   GEN pol = cgetg(l, t_VECSMALL);
     798      278168 :   pol[1] = 0;
     799     7357897 :   for (i=0, offset=0; offset+1 < lm; i++, offset += 2)
     800     7079729 :     pol[i+2] = remll_pre(*int_W(x,offset+1), *int_W(x,offset), p, pi);
     801      278168 :   if (offset < lm)
     802      211741 :     pol[i+2] = (*int_W(x,offset)) % p;
     803      278168 :   return Flx_renormalize(pol,l);
     804             : }
     805             : 
     806             : static GEN
     807           0 : Z_mod2BIL_Flx_3(GEN x, long d, ulong p)
     808             : {
     809           0 :   long i, offset, lm = lgefint(x)-2, l = d+3;
     810           0 :   ulong pi = get_Fl_red(p);
     811           0 :   GEN pol = cgetg(l, t_VECSMALL);
     812           0 :   pol[1] = 0;
     813           0 :   for (i=0, offset=0; offset+2 < lm; i++, offset += 3)
     814           0 :     pol[i+2] = remlll_pre(*int_W(x,offset+2), *int_W(x,offset+1),
     815           0 :                           *int_W(x,offset), p, pi);
     816           0 :   if (offset+1 < lm)
     817           0 :     pol[i+2] = remll_pre(*int_W(x,offset+1), *int_W(x,offset), p, pi);
     818           0 :   else if (offset < lm)
     819           0 :     pol[i+2] = (*int_W(x,offset)) % p;
     820           0 :   return Flx_renormalize(pol,l);
     821             : }
     822             : 
     823             : static GEN
     824      275238 : Z_mod2BIL_Flx(GEN x, long bs, long d, ulong p)
     825             : {
     826      275238 :   return bs==2 ? Z_mod2BIL_Flx_2(x, d, p): Z_mod2BIL_Flx_3(x, d, p);
     827             : }
     828             : 
     829             : static GEN
     830      264517 : Flx_mulspec_mulii_inflate(GEN x, GEN y, long N, ulong p, long nx, long ny)
     831             : {
     832      264517 :   pari_sp av = avma;
     833      264517 :   GEN z = mulii(Flx_eval2BILspec(x,N,nx), Flx_eval2BILspec(y,N,ny));
     834      264517 :   return gerepileupto(av, Z_mod2BIL_Flx(z, N, nx+ny-2, p));
     835             : }
     836             : 
     837             : static GEN
     838    15566542 : kron_pack_Flx_spec_bits(GEN x, long b, long l) {
     839             :   GEN y;
     840             :   long i;
     841    15566542 :   if (l == 0)
     842     3445464 :     return gen_0;
     843    12121078 :   y = cgetg(l + 1, t_VECSMALL);
     844   651241876 :   for(i = 1; i <= l; i++)
     845   639128537 :     y[i] = x[l - i];
     846    12113339 :   return nv_fromdigits_2k(y, b);
     847             : }
     848             : 
     849             : /* assume b < BITS_IN_LONG */
     850             : static GEN
     851     5343985 : kron_unpack_Flx_bits_narrow(GEN z, long b, ulong p) {
     852     5343985 :   GEN v = binary_2k_nv(z, b), x;
     853     5344104 :   long i, l = lg(v) + 1;
     854     5344104 :   x = cgetg(l, t_VECSMALL);
     855   548033314 :   for (i = 2; i < l; i++)
     856   542688921 :     x[i] = v[l - i] % p;
     857     5344393 :   return Flx_renormalize(x, l);
     858             : }
     859             : 
     860             : static GEN
     861     3351359 : kron_unpack_Flx_bits_wide(GEN z, long b, ulong p, ulong pi) {
     862     3351359 :   GEN v = binary_2k(z, b), x, y;
     863     3349183 :   long i, l = lg(v) + 1, ly;
     864     3349183 :   x = cgetg(l, t_VECSMALL);
     865   142181144 :   for (i = 2; i < l; i++) {
     866   138829098 :     y = gel(v, l - i);
     867   138829098 :     ly = lgefint(y);
     868   138829098 :     switch (ly) {
     869     5102106 :     case 2: x[i] = 0; break;
     870    15454223 :     case 3: x[i] = *int_W_lg(y, 0, ly) % p; break;
     871   109056188 :     case 4: x[i] = remll_pre(*int_W_lg(y, 1, ly), *int_W_lg(y, 0, ly), p, pi); break;
     872    27649722 :     case 5: x[i] = remlll_pre(*int_W_lg(y, 2, ly), *int_W_lg(y, 1, ly),
     873     9216581 :                               *int_W_lg(y, 0, ly), p, pi); break;
     874           0 :     default: x[i] = umodiu(gel(v, l - i), p);
     875             :     }
     876             :   }
     877     3352046 :   return Flx_renormalize(x, l);
     878             : }
     879             : 
     880             : static GEN
     881     4682975 : Flx_mulspec_Kronecker(GEN A, GEN B, long b, ulong p, long lA, long lB)
     882             : {
     883             :   GEN C, D;
     884     4682975 :   pari_sp av = avma;
     885     4682975 :   A =  kron_pack_Flx_spec_bits(A, b, lA);
     886     4685817 :   B =  kron_pack_Flx_spec_bits(B, b, lB);
     887     4685921 :   C = gerepileuptoint(av, mulii(A, B));
     888     4684763 :   if (b < BITS_IN_LONG)
     889     1659520 :     D =  kron_unpack_Flx_bits_narrow(C, b, p);
     890             :   else
     891             :   {
     892     3025243 :     ulong pi = get_Fl_red(p);
     893     3023546 :     D = kron_unpack_Flx_bits_wide(C, b, p, pi);
     894             :   }
     895     4684262 :   return D;
     896             : }
     897             : 
     898             : static GEN
     899      604440 : Flx_sqrspec_Kronecker(GEN A, long b, ulong p, long lA)
     900             : {
     901             :   GEN C, D;
     902      604440 :   A =  kron_pack_Flx_spec_bits(A, b, lA);
     903      604485 :   C = sqri(A);
     904      604511 :   if (b < BITS_IN_LONG)
     905      406241 :     D =  kron_unpack_Flx_bits_narrow(C, b, p);
     906             :   else
     907             :   {
     908      198270 :     ulong pi = get_Fl_red(p);
     909      198264 :     D = kron_unpack_Flx_bits_wide(C, b, p, pi);
     910             :   }
     911      604480 :   return D;
     912             : }
     913             : 
     914             : /* fast product (Karatsuba) of polynomials a,b. These are not real GENs, a+2,
     915             :  * b+2 were sent instead. na, nb = number of terms of a, b.
     916             :  * Only c, c0, c1, c2 are genuine GEN.
     917             :  */
     918             : static GEN
     919   252419669 : Flx_mulspec(GEN a, GEN b, ulong p, long na, long nb)
     920             : {
     921             :   GEN a0,c,c0;
     922   252419669 :   long n0, n0a, i, v = 0;
     923             :   pari_sp av;
     924             : 
     925   328053171 :   while (na && !a[0]) { a++; na--; v++; }
     926   391923394 :   while (nb && !b[0]) { b++; nb--; v++; }
     927   252419669 :   if (na < nb) swapspec(a,b, na,nb);
     928   252419669 :   if (!nb) return pol0_Flx(0);
     929             : 
     930   233754819 :   av = avma;
     931   233754819 :   if (nb >= get_Fl_threshold(p, Flx_MUL_MULII_LIMIT, Flx_MUL2_MULII_LIMIT))
     932             :   {
     933     5009761 :     long m = maxbitcoeffpol(p,nb);
     934     5007380 :     switch (m)
     935             :     {
     936       44831 :     case BITS_IN_QUARTULONG:
     937       44831 :       return Flx_shiftip(av,Flx_mulspec_quartmulii(a,b,p,na,nb), v);
     938        5319 :     case BITS_IN_HALFULONG:
     939        5319 :       return Flx_shiftip(av,Flx_mulspec_halfmulii(a,b,p,na,nb), v);
     940        9841 :     case BITS_IN_LONG:
     941        9841 :       return Flx_shiftip(av,Flx_mulspec_mulii(a,b,p,na,nb), v);
     942      264517 :     case 2*BITS_IN_LONG:
     943      264517 :       return Flx_shiftip(av,Flx_mulspec_mulii_inflate(a,b,2,p,na,nb), v);
     944           0 :     case 3*BITS_IN_LONG:
     945           0 :       return Flx_shiftip(av,Flx_mulspec_mulii_inflate(a,b,3,p,na,nb), v);
     946     4682872 :     default:
     947     4682872 :       return Flx_shiftip(av,Flx_mulspec_Kronecker(a,b,m,p,na,nb), v);
     948             :     }
     949             :   }
     950   228935747 :   if (nb < get_Fl_threshold(p, Flx_MUL_KARATSUBA_LIMIT, Flx_MUL2_KARATSUBA_LIMIT))
     951   227817540 :     return Flx_shiftip(av,Flx_mulspec_basecase(a,b,p,na,nb), v);
     952     1146982 :   i=(na>>1); n0=na-i; na=i;
     953     1146982 :   a0=a+n0; n0a=n0;
     954     1911290 :   while (n0a && !a[n0a-1]) n0a--;
     955             : 
     956     1146982 :   if (nb > n0)
     957             :   {
     958             :     GEN b0,c1,c2;
     959             :     long n0b;
     960             : 
     961     1120153 :     nb -= n0; b0 = b+n0; n0b = n0;
     962     2178904 :     while (n0b && !b[n0b-1]) n0b--;
     963     1120153 :     c =  Flx_mulspec(a,b,p,n0a,n0b);
     964     1120153 :     c0 = Flx_mulspec(a0,b0,p,na,nb);
     965             : 
     966     1120153 :     c2 = Flx_addspec(a0,a,p,na,n0a);
     967     1120153 :     c1 = Flx_addspec(b0,b,p,nb,n0b);
     968             : 
     969     1120153 :     c1 = Flx_mul(c1,c2,p);
     970     1120153 :     c2 = Flx_add(c0,c,p);
     971             : 
     972     1120153 :     c2 = Flx_neg_inplace(c2,p);
     973     1120153 :     c2 = Flx_add(c1,c2,p);
     974     1120153 :     c0 = Flx_addshift(c0,c2 ,p, n0);
     975             :   }
     976             :   else
     977             :   {
     978       26829 :     c  = Flx_mulspec(a,b,p,n0a,nb);
     979       26829 :     c0 = Flx_mulspec(a0,b,p,na,nb);
     980             :   }
     981     1146982 :   c0 = Flx_addshift(c0,c,p,n0);
     982     1146982 :   return Flx_shiftip(av,c0, v);
     983             : }
     984             : 
     985             : GEN
     986   248377844 : Flx_mul(GEN x, GEN y, ulong p)
     987             : {
     988   248377844 :   GEN z = Flx_mulspec(x+2,y+2,p, lgpol(x),lgpol(y));
     989   248593118 :   z[1] = x[1]; return z;
     990             : }
     991             : 
     992             : static GEN
     993   198666046 : Flx_sqrspec_basecase(GEN x, ulong p, long nx)
     994             : {
     995             :   long i, lz, nz;
     996             :   ulong p1;
     997             :   GEN z;
     998             : 
     999   198666046 :   if (!nx) return pol0_Flx(0);
    1000   198666046 :   lz = (nx << 1) + 1, nz = lz-2;
    1001   198666046 :   z = cgetg(lz, t_VECSMALL) + 2;
    1002   198322586 :   if (SMALL_ULONG(p))
    1003             :   {
    1004   140960937 :     z[0] = x[0]*x[0]%p;
    1005   681322541 :     for (i=1; i<nx; i++)
    1006             :     {
    1007   540558707 :       p1 = Flx_mullimb_ok(x+i,x,p,0, (i+1)>>1);
    1008   540361604 :       p1 <<= 1;
    1009   540361604 :       if ((i&1) == 0) p1 += x[i>>1] * x[i>>1];
    1010   540361604 :       z[i] = p1 % p;
    1011             :     }
    1012   684948677 :     for (  ; i<nz; i++)
    1013             :     {
    1014   543658564 :       p1 = Flx_mullimb_ok(x+i,x,p,i-nx+1, (i+1)>>1);
    1015   544184843 :       p1 <<= 1;
    1016   544184843 :       if ((i&1) == 0) p1 += x[i>>1] * x[i>>1];
    1017   544184843 :       z[i] = p1 % p;
    1018             :     }
    1019             :   }
    1020             :   else
    1021             :   {
    1022    57361649 :     ulong pi = get_Fl_red(p);
    1023    57413535 :     z[0] = Fl_sqr_pre(x[0], p, pi);
    1024   364249783 :     for (i=1; i<nx; i++)
    1025             :     {
    1026   306864139 :       p1 = Flx_mullimb(x+i,x,p,pi,0, (i+1)>>1);
    1027   307026475 :       p1 = Fl_add(p1, p1, p);
    1028   306725082 :       if ((i&1) == 0) p1 = Fl_add(p1, Fl_sqr_pre(x[i>>1], p, pi), p);
    1029   306684149 :       z[i] = p1;
    1030             :     }
    1031   364281116 :     for (  ; i<nz; i++)
    1032             :     {
    1033   306792088 :       p1 = Flx_mullimb(x+i,x,p,pi,i-nx+1, (i+1)>>1);
    1034   307541025 :       p1 = Fl_add(p1, p1, p);
    1035   307278800 :       if ((i&1) == 0) p1 = Fl_add(p1, Fl_sqr_pre(x[i>>1], p, pi), p);
    1036   306895472 :       z[i] = p1;
    1037             :     }
    1038             :   }
    1039   198779141 :   z -= 2; return Flx_renormalize(z, lz);
    1040             : }
    1041             : 
    1042             : static GEN
    1043        2265 : Flx_sqrspec_sqri(GEN a, ulong p, long na)
    1044             : {
    1045        2265 :   GEN z=sqrispec(a,na);
    1046        2265 :   return int_to_Flx(z,p);
    1047             : }
    1048             : 
    1049             : static GEN
    1050         136 : Flx_sqrspec_halfsqri(GEN a, ulong p, long na)
    1051             : {
    1052         136 :   GEN z = sqri(Flx_to_int_halfspec(a,na));
    1053         136 :   return int_to_Flx_half(z,p);
    1054             : }
    1055             : 
    1056             : static GEN
    1057        7101 : Flx_sqrspec_quartsqri(GEN a, ulong p, long na)
    1058             : {
    1059        7101 :   GEN z = sqri(Flx_to_int_quartspec(a,na));
    1060        7101 :   return int_to_Flx_quart(z,p);
    1061             : }
    1062             : 
    1063             : static GEN
    1064       10721 : Flx_sqrspec_sqri_inflate(GEN x, long N, ulong p, long nx)
    1065             : {
    1066       10721 :   pari_sp av = avma;
    1067       10721 :   GEN  z = sqri(Flx_eval2BILspec(x,N,nx));
    1068       10721 :   return gerepileupto(av, Z_mod2BIL_Flx(z, N, (nx-1)*2, p));
    1069             : }
    1070             : 
    1071             : static GEN
    1072   198909214 : Flx_sqrspec(GEN a, ulong p, long na)
    1073             : {
    1074             :   GEN a0, c, c0;
    1075   198909214 :   long n0, n0a, i, v = 0, m;
    1076             :   pari_sp av;
    1077             : 
    1078   271773674 :   while (na && !a[0]) { a++; na--; v += 2; }
    1079   198909214 :   if (!na) return pol0_Flx(0);
    1080             : 
    1081   198806974 :   av = avma;
    1082   198806974 :   if (na >= get_Fl_threshold(p, Flx_SQR_SQRI_LIMIT, Flx_SQR2_SQRI_LIMIT))
    1083             :   {
    1084      624675 :     m = maxbitcoeffpol(p,na);
    1085      624657 :     switch(m)
    1086             :     {
    1087        7101 :     case BITS_IN_QUARTULONG:
    1088        7101 :       return Flx_shiftip(av, Flx_sqrspec_quartsqri(a,p,na), v);
    1089         136 :     case BITS_IN_HALFULONG:
    1090         136 :       return Flx_shiftip(av, Flx_sqrspec_halfsqri(a,p,na), v);
    1091        2265 :     case BITS_IN_LONG:
    1092        2265 :       return Flx_shiftip(av, Flx_sqrspec_sqri(a,p,na), v);
    1093       10721 :     case 2*BITS_IN_LONG:
    1094       10721 :       return Flx_shiftip(av, Flx_sqrspec_sqri_inflate(a,2,p,na), v);
    1095           0 :     case 3*BITS_IN_LONG:
    1096           0 :       return Flx_shiftip(av, Flx_sqrspec_sqri_inflate(a,3,p,na), v);
    1097      604434 :     default:
    1098      604434 :       return Flx_shiftip(av, Flx_sqrspec_Kronecker(a,m,p,na), v);
    1099             :     }
    1100             :   }
    1101   198524009 :   if (na < get_Fl_threshold(p, Flx_SQR_KARATSUBA_LIMIT, Flx_SQR2_KARATSUBA_LIMIT))
    1102   198577219 :     return Flx_shiftip(av, Flx_sqrspec_basecase(a,p,na), v);
    1103       55833 :   i=(na>>1); n0=na-i; na=i;
    1104       55833 :   a0=a+n0; n0a=n0;
    1105       70470 :   while (n0a && !a[n0a-1]) n0a--;
    1106             : 
    1107       55833 :   c = Flx_sqrspec(a,p,n0a);
    1108       55833 :   c0= Flx_sqrspec(a0,p,na);
    1109       55833 :   if (p == 2) n0 *= 2;
    1110             :   else
    1111             :   {
    1112       55814 :     GEN c1, t = Flx_addspec(a0,a,p,na,n0a);
    1113       55814 :     t = Flx_sqr(t,p);
    1114       55814 :     c1= Flx_add(c0,c, p);
    1115       55814 :     c1= Flx_sub(t, c1, p);
    1116       55814 :     c0 = Flx_addshift(c0,c1,p,n0);
    1117             :   }
    1118       55833 :   c0 = Flx_addshift(c0,c,p,n0);
    1119       55833 :   return Flx_shiftip(av,c0,v);
    1120             : }
    1121             : 
    1122             : GEN
    1123   198661325 : Flx_sqr(GEN x, ulong p)
    1124             : {
    1125   198661325 :   GEN z = Flx_sqrspec(x+2,p, lgpol(x));
    1126   199587315 :   z[1] = x[1]; return z;
    1127             : }
    1128             : 
    1129             : GEN
    1130        8973 : Flx_powu(GEN x, ulong n, ulong p)
    1131             : {
    1132        8973 :   GEN y = pol1_Flx(x[1]), z;
    1133             :   ulong m;
    1134        8957 :   if (n == 0) return y;
    1135        8957 :   m = n; z = x;
    1136             :   for (;;)
    1137             :   {
    1138       34537 :     if (m&1UL) y = Flx_mul(y,z, p);
    1139       34525 :     m >>= 1; if (!m) return y;
    1140       25572 :     z = Flx_sqr(z, p);
    1141             :   }
    1142             : }
    1143             : 
    1144             : GEN
    1145       13146 : Flx_halve(GEN y, ulong p)
    1146             : {
    1147             :   GEN z;
    1148             :   long i, l;
    1149       13146 :   z = cgetg_copy(y, &l); z[1] = y[1];
    1150       54881 :   for(i=2; i<l; i++) uel(z,i) = Fl_halve(uel(y,i), p);
    1151       13146 :   return z;
    1152             : }
    1153             : 
    1154             : static GEN
    1155     3381884 : Flx_recipspec(GEN x, long l, long n)
    1156             : {
    1157             :   long i;
    1158     3381884 :   GEN z=cgetg(n+2,t_VECSMALL)+2;
    1159    88049295 :   for(i=0; i<l; i++)
    1160    84668733 :     z[n-i-1] = x[i];
    1161     8092718 :   for(   ; i<n; i++)
    1162     4712156 :     z[n-i-1] = 0;
    1163     3380562 :   return Flx_renormalize(z-2,n+2);
    1164             : }
    1165             : 
    1166             : GEN
    1167           0 : Flx_recip(GEN x)
    1168             : {
    1169           0 :   GEN z=Flx_recipspec(x+2,lgpol(x),lgpol(x));
    1170           0 :   z[1]=x[1];
    1171           0 :   return z;
    1172             : }
    1173             : 
    1174             : /* Return h^degpol(P) P(x / h) */
    1175             : GEN
    1176        1116 : Flx_rescale(GEN P, ulong h, ulong p)
    1177             : {
    1178        1116 :   long i, l = lg(P);
    1179        1116 :   GEN Q = cgetg(l,t_VECSMALL);
    1180        1116 :   ulong hi = h;
    1181        1116 :   Q[l-1] = P[l-1];
    1182       12519 :   for (i=l-2; i>=2; i--)
    1183             :   {
    1184       12519 :     Q[i] = Fl_mul(P[i], hi, p);
    1185       12519 :     if (i == 2) break;
    1186       11402 :     hi = Fl_mul(hi,h, p);
    1187             :   }
    1188        1117 :   Q[1] = P[1]; return Q;
    1189             : }
    1190             : 
    1191             : /*
    1192             :  * x/polrecip(P)+O(x^n)
    1193             :  */
    1194             : static GEN
    1195      118649 : Flx_invBarrett_basecase(GEN T, ulong p)
    1196             : {
    1197      118649 :   long i, l=lg(T)-1, lr=l-1, k;
    1198      118649 :   GEN r=cgetg(lr,t_VECSMALL); r[1] = T[1];
    1199      118649 :   r[2] = 1;
    1200      118649 :   if (SMALL_ULONG(p))
    1201      452948 :     for (i=3;i<lr;i++)
    1202             :     {
    1203      449100 :       ulong u = uel(T, l-i+2);
    1204    28843780 :       for (k=3; k<i; k++)
    1205    28394680 :         { u += uel(T,l-i+k) * uel(r, k); if (u & HIGHBIT) u %= p; }
    1206      449100 :       r[i] = Fl_neg(u % p, p);
    1207             :     }
    1208             :   else
    1209     1900074 :     for (i=3;i<lr;i++)
    1210             :     {
    1211     1785273 :       ulong u = Fl_neg(uel(T,l-i+2), p);
    1212    46734427 :       for (k=3; k<i; k++)
    1213    44949154 :         u = Fl_sub(u, Fl_mul(uel(T,l-i+k), uel(r,k), p), p);
    1214     1785273 :       r[i] = u;
    1215             :     }
    1216      118649 :   return Flx_renormalize(r,lr);
    1217             : }
    1218             : 
    1219             : /* Return new lgpol */
    1220             : static long
    1221     1796783 : Flx_lgrenormalizespec(GEN x, long lx)
    1222             : {
    1223             :   long i;
    1224    11191014 :   for (i = lx-1; i>=0; i--)
    1225    11191065 :     if (x[i]) break;
    1226     1796783 :   return i+1;
    1227             : }
    1228             : static GEN
    1229       21892 : Flx_invBarrett_Newton(GEN T, ulong p)
    1230             : {
    1231       21892 :   long nold, lx, lz, lq, l = degpol(T), lQ;
    1232       21892 :   GEN q, y, z, x = zero_zv(l+1) + 2;
    1233       21892 :   ulong mask = quadratic_prec_mask(l-2); /* assume l > 2 */
    1234             :   pari_sp av;
    1235             : 
    1236       21892 :   y = T+2;
    1237       21892 :   q = Flx_recipspec(y,l+1,l+1); lQ = lgpol(q); q+=2;
    1238       21891 :   av = avma;
    1239             :   /* We work on _spec_ Flx's, all the l[xzq12] below are lgpol's */
    1240             : 
    1241             :   /* initialize */
    1242       21891 :   x[0] = Fl_inv(q[0], p);
    1243       21891 :   if (lQ>1 && q[1])
    1244        5046 :   {
    1245        5046 :     ulong u = q[1];
    1246        5046 :     if (x[0] != 1) u = Fl_mul(u, Fl_sqr(x[0],p), p);
    1247        5046 :     x[1] = p - u; lx = 2;
    1248             :   }
    1249             :   else
    1250       16845 :     lx = 1;
    1251       21891 :   nold = 1;
    1252      152427 :   for (; mask > 1; set_avma(av))
    1253             :   { /* set x -= x(x*q - 1) + O(t^(nnew + 1)), knowing x*q = 1 + O(t^(nold+1)) */
    1254      130553 :     long i, lnew, nnew = nold << 1;
    1255             : 
    1256      130553 :     if (mask & 1) nnew--;
    1257      130553 :     mask >>= 1;
    1258             : 
    1259      130553 :     lnew = nnew + 1;
    1260      130553 :     lq = Flx_lgrenormalizespec(q, minss(lQ, lnew));
    1261      130575 :     z = Flx_mulspec(x, q, p, lx, lq); /* FIXME: high product */
    1262      130530 :     lz = lgpol(z); if (lz > lnew) lz = lnew;
    1263      130530 :     z += 2;
    1264             :     /* subtract 1 [=>first nold words are 0]: renormalize so that z(0) != 0 */
    1265      290521 :     for (i = nold; i < lz; i++) if (z[i]) break;
    1266      130530 :     nold = nnew;
    1267      130530 :     if (i >= lz) continue; /* z-1 = 0(t^(nnew + 1)) */
    1268             : 
    1269             :     /* z + i represents (x*q - 1) / t^i */
    1270       92719 :     lz = Flx_lgrenormalizespec (z+i, lz-i);
    1271       92725 :     z = Flx_mulspec(x, z+i, p, lx, lz); /* FIXME: low product */
    1272       92725 :     lz = lgpol(z); z += 2;
    1273       92724 :     if (lz > lnew-i) lz = Flx_lgrenormalizespec(z, lnew-i);
    1274             : 
    1275       92724 :     lx = lz+ i;
    1276       92724 :     y  = x + i; /* x -= z * t^i, in place */
    1277      846948 :     for (i = 0; i < lz; i++) y[i] = Fl_neg(z[i], p);
    1278             :   }
    1279       21891 :   x -= 2; setlg(x, lx + 2); x[1] = T[1];
    1280       21891 :   return x;
    1281             : }
    1282             : 
    1283             : GEN
    1284      141230 : Flx_invBarrett(GEN T, ulong p)
    1285             : {
    1286      141230 :   pari_sp ltop = avma;
    1287      141230 :   long l = lgpol(T);
    1288             :   GEN r;
    1289      141230 :   if (l < 3) return pol0_Flx(T[1]);
    1290      140541 :   if (l < get_Fl_threshold(p, Flx_INVBARRETT_LIMIT, Flx_INVBARRETT2_LIMIT))
    1291             :   {
    1292      118649 :     ulong c = T[l+1];
    1293      118649 :     if (c!=1)
    1294             :     {
    1295       97452 :       ulong ci = Fl_inv(c,p);
    1296       97452 :       T=Flx_Fl_mul(T, ci, p);
    1297       97452 :       r=Flx_invBarrett_basecase(T,p);
    1298       97452 :       r=Flx_Fl_mul(r,ci,p);
    1299             :     }
    1300             :     else
    1301       21197 :       r=Flx_invBarrett_basecase(T,p);
    1302             :   }
    1303             :   else
    1304       21892 :     r = Flx_invBarrett_Newton(T,p);
    1305      140540 :   return gerepileuptoleaf(ltop, r);
    1306             : }
    1307             : 
    1308             : GEN
    1309    54791731 : Flx_get_red(GEN T, ulong p)
    1310             : {
    1311    54791731 :   if (typ(T)!=t_VECSMALL
    1312    54763806 :     || lgpol(T) < get_Fl_threshold(p, Flx_BARRETT_LIMIT,
    1313             :                                        Flx_BARRETT2_LIMIT))
    1314    54780692 :     return T;
    1315        8146 :   retmkvec2(Flx_invBarrett(T,p),T);
    1316             : }
    1317             : 
    1318             : /* separate from Flx_divrem for maximal speed. */
    1319             : static GEN
    1320   470387382 : Flx_rem_basecase(GEN x, GEN y, ulong p)
    1321             : {
    1322             :   pari_sp av;
    1323             :   GEN z, c;
    1324             :   long dx,dy,dy1,dz,i,j;
    1325             :   ulong p1,inv;
    1326   470387382 :   long vs=x[1];
    1327             : 
    1328   470387382 :   dy = degpol(y); if (!dy) return pol0_Flx(x[1]);
    1329   459594381 :   dx = degpol(x);
    1330   459445561 :   dz = dx-dy; if (dz < 0) return Flx_copy(x);
    1331   459445561 :   x += 2; y += 2;
    1332   459445561 :   inv = y[dy];
    1333   459445561 :   if (inv != 1UL) inv = Fl_inv(inv,p);
    1334   530076107 :   for (dy1=dy-1; dy1>=0 && !y[dy1]; dy1--);
    1335             : 
    1336   460324497 :   c = cgetg(dy+3, t_VECSMALL); c[1]=vs; c += 2; av=avma;
    1337   459029991 :   z = cgetg(dz+3, t_VECSMALL); z[1]=vs; z += 2;
    1338             : 
    1339   458065831 :   if (SMALL_ULONG(p))
    1340             :   {
    1341   305686430 :     z[dz] = (inv*x[dx]) % p;
    1342  1288596468 :     for (i=dx-1; i>=dy; --i)
    1343             :     {
    1344   982910038 :       p1 = p - x[i]; /* compute -p1 instead of p1 (pb with ulongs otherwise) */
    1345  8147821967 :       for (j=i-dy1; j<=i && j<=dz; j++)
    1346             :       {
    1347  7164911929 :         p1 += z[j]*y[i-j];
    1348  7164911929 :         if (p1 & HIGHBIT) p1 %= p;
    1349             :       }
    1350   982910038 :       p1 %= p;
    1351   982910038 :       z[i-dy] = p1? ((p - p1)*inv) % p: 0;
    1352             :     }
    1353  2295184185 :     for (i=0; i<dy; i++)
    1354             :     {
    1355  1989722318 :       p1 = z[0]*y[i];
    1356 11035710634 :       for (j=maxss(1,i-dy1); j<=i && j<=dz; j++)
    1357             :       {
    1358  9045988316 :         p1 += z[j]*y[i-j];
    1359  9045988316 :         if (p1 & HIGHBIT) p1 %= p;
    1360             :       }
    1361  1989660845 :       c[i] = Fl_sub(x[i], p1%p, p);
    1362             :     }
    1363             :   }
    1364             :   else
    1365             :   {
    1366   152379401 :     ulong pi = get_Fl_red(p);
    1367   152291341 :     z[dz] = Fl_mul_pre(inv, x[dx], p, pi);
    1368   549427139 :     for (i=dx-1; i>=dy; --i)
    1369             :     {
    1370   397062834 :       p1 = p - x[i]; /* compute -p1 instead of p1 (pb with ulongs otherwise) */
    1371  1775553698 :       for (j=i-dy1; j<=i && j<=dz; j++)
    1372  1377504642 :         p1 = Fl_addmul_pre(p1, z[j], y[i - j], p, pi);
    1373   398049056 :       z[i-dy] = p1? Fl_mul_pre(p - p1, inv, p, pi): 0;
    1374             :     }
    1375  1150401192 :     for (i=0; i<dy; i++)
    1376             :     {
    1377   998295150 :       p1 = Fl_mul_pre(z[0],y[i],p,pi);
    1378  3050083118 :       for (j=maxss(1,i-dy1); j<=i && j<=dz; j++)
    1379  2048241590 :         p1 = Fl_addmul_pre(p1, z[j], y[i - j], p, pi);
    1380   987792702 :       c[i] = Fl_sub(x[i], p1, p);
    1381             :     }
    1382             :   }
    1383   560415588 :   i = dy-1; while (i>=0 && !c[i]) i--;
    1384   457567909 :   set_avma(av); return Flx_renormalize(c-2, i+3);
    1385             : }
    1386             : 
    1387             : /* as FpX_divrem but working only on ulong types.
    1388             :  * if relevant, *pr is the last object on stack */
    1389             : static GEN
    1390    29183631 : Flx_divrem_basecase(GEN x, GEN y, ulong p, GEN *pr)
    1391             : {
    1392             :   GEN z,q,c;
    1393             :   long dx,dy,dy1,dz,i,j;
    1394             :   ulong p1,inv;
    1395    29183631 :   long sv=x[1];
    1396             : 
    1397    29183631 :   dy = degpol(y);
    1398    29182979 :   if (dy<0) pari_err_INV("Flx_divrem",y);
    1399    29183025 :   if (pr == ONLY_REM) return Flx_rem_basecase(x, y, p);
    1400    29182564 :   if (!dy)
    1401             :   {
    1402     4706333 :     if (pr && pr != ONLY_DIVIDES) *pr = pol0_Flx(sv);
    1403     4706311 :     if (y[2] == 1UL) return Flx_copy(x);
    1404     3100482 :     return Flx_Fl_mul(x, Fl_inv(y[2], p), p);
    1405             :   }
    1406    24476231 :   dx = degpol(x);
    1407    24480171 :   dz = dx-dy;
    1408    24480171 :   if (dz < 0)
    1409             :   {
    1410      366774 :     q = pol0_Flx(sv);
    1411      366778 :     if (pr && pr != ONLY_DIVIDES) *pr = Flx_copy(x);
    1412      366777 :     return q;
    1413             :   }
    1414    24113397 :   x += 2;
    1415    24113397 :   y += 2;
    1416    24113397 :   z = cgetg(dz + 3, t_VECSMALL); z[1] = sv; z += 2;
    1417    24112695 :   inv = uel(y, dy);
    1418    24112695 :   if (inv != 1UL) inv = Fl_inv(inv,p);
    1419    40750112 :   for (dy1=dy-1; dy1>=0 && !y[dy1]; dy1--);
    1420             : 
    1421    24115451 :   if (SMALL_ULONG(p))
    1422             :   {
    1423    22983748 :     z[dz] = (inv*x[dx]) % p;
    1424    68827085 :     for (i=dx-1; i>=dy; --i)
    1425             :     {
    1426    45843337 :       p1 = p - x[i]; /* compute -p1 instead of p1 (pb with ulongs otherwise) */
    1427   166928414 :       for (j=i-dy1; j<=i && j<=dz; j++)
    1428             :       {
    1429   121085077 :         p1 += z[j]*y[i-j];
    1430   121085077 :         if (p1 & HIGHBIT) p1 %= p;
    1431             :       }
    1432    45843337 :       p1 %= p;
    1433    45843337 :       z[i-dy] = p1? (long) ((p - p1)*inv) % p: 0;
    1434             :     }
    1435             :   }
    1436             :   else
    1437             :   {
    1438     1131703 :     z[dz] = Fl_mul(inv, x[dx], p);
    1439     7210835 :     for (i=dx-1; i>=dy; --i)
    1440             :     { /* compute -p1 instead of p1 (pb with ulongs otherwise) */
    1441     6079243 :       p1 = p - uel(x,i);
    1442    21817671 :       for (j=i-dy1; j<=i && j<=dz; j++)
    1443    15738432 :         p1 = Fl_add(p1, Fl_mul(z[j],y[i-j],p), p);
    1444     6079239 :       z[i-dy] = p1? Fl_mul(p - p1, inv, p): 0;
    1445             :     }
    1446             :   }
    1447    24115340 :   q = Flx_renormalize(z-2, dz+3);
    1448    24115403 :   if (!pr) return q;
    1449             : 
    1450    17350200 :   c = cgetg(dy + 3, t_VECSMALL); c[1] = sv; c += 2;
    1451    17350015 :   if (SMALL_ULONG(p))
    1452             :   {
    1453   182505414 :     for (i=0; i<dy; i++)
    1454             :     {
    1455   166200840 :       p1 = (ulong)z[0]*y[i];
    1456   404811328 :       for (j=maxss(1,i-dy1); j<=i && j<=dz; j++)
    1457             :       {
    1458   238610488 :         p1 += (ulong)z[j]*y[i-j];
    1459   238610488 :         if (p1 & HIGHBIT) p1 %= p;
    1460             :       }
    1461   166200602 :       c[i] = Fl_sub(x[i], p1%p, p);
    1462             :     }
    1463             :   }
    1464             :   else
    1465             :   {
    1466    14539553 :     for (i=0; i<dy; i++)
    1467             :     {
    1468    13494294 :       p1 = Fl_mul(z[0],y[i],p);
    1469    48507077 :       for (j=maxss(1,i-dy1); j<=i && j<=dz; j++)
    1470    35012785 :         p1 = Fl_add(p1, Fl_mul(z[j],y[i-j],p), p);
    1471    13494293 :       c[i] = Fl_sub(x[i], p1, p);
    1472             :     }
    1473             :   }
    1474    23796518 :   i=dy-1; while (i>=0 && !c[i]) i--;
    1475    17349833 :   c = Flx_renormalize(c-2, i+3);
    1476    17350284 :   if (pr == ONLY_DIVIDES)
    1477         332 :   { if (lg(c) != 2) return NULL; }
    1478             :   else
    1479    17349952 :     *pr = c;
    1480    17350186 :   return q;
    1481             : }
    1482             : 
    1483             : /* Compute x mod T where 2 <= degpol(T) <= l+1 <= 2*(degpol(T)-1)
    1484             :  * and mg is the Barrett inverse of T. */
    1485             : static GEN
    1486      747403 : Flx_divrem_Barrettspec(GEN x, long l, GEN mg, GEN T, ulong p, GEN *pr)
    1487             : {
    1488             :   GEN q, r;
    1489      747403 :   long lt = degpol(T); /*We discard the leading term*/
    1490             :   long ld, lm, lT, lmg;
    1491      747352 :   ld = l-lt;
    1492      747352 :   lm = minss(ld, lgpol(mg));
    1493      747633 :   lT  = Flx_lgrenormalizespec(T+2,lt);
    1494      747713 :   lmg = Flx_lgrenormalizespec(mg+2,lm);
    1495      747660 :   q = Flx_recipspec(x+lt,ld,ld);               /* q = rec(x)      lz<=ld*/
    1496      747073 :   q = Flx_mulspec(q+2,mg+2,p,lgpol(q),lmg);    /* q = rec(x) * mg lz<=ld+lm*/
    1497      747889 :   q = Flx_recipspec(q+2,minss(ld,lgpol(q)),ld);/* q = rec (rec(x) * mg) lz<=ld*/
    1498      747093 :   if (!pr) return q;
    1499      739604 :   r = Flx_mulspec(q+2,T+2,p,lgpol(q),lT);      /* r = q*pol       lz<=ld+lt*/
    1500      740400 :   r = Flx_subspec(x,r+2,p,lt,minss(lt,lgpol(r)));/* r = x - q*pol lz<=lt */
    1501      739921 :   if (pr == ONLY_REM) return r;
    1502      376531 :   *pr = r; return q;
    1503             : }
    1504             : 
    1505             : static GEN
    1506      485337 : Flx_divrem_Barrett(GEN x, GEN mg, GEN T, ulong p, GEN *pr)
    1507             : {
    1508      485337 :   GEN q = NULL, r = Flx_copy(x);
    1509      485368 :   long l = lgpol(x), lt = degpol(T), lm = 2*lt-1, v = T[1];
    1510             :   long i;
    1511      485359 :   if (l <= lt)
    1512             :   {
    1513           0 :     if (pr == ONLY_REM) return Flx_copy(x);
    1514           0 :     if (pr == ONLY_DIVIDES) return lgpol(x)? NULL: pol0_Flx(v);
    1515           0 :     if (pr) *pr = Flx_copy(x);
    1516           0 :     return pol0_Flx(v);
    1517             :   }
    1518      485359 :   if (lt <= 1)
    1519         689 :     return Flx_divrem_basecase(x,T,p,pr);
    1520      484670 :   if (pr != ONLY_REM && l>lm)
    1521       16740 :   { q = zero_zv(l-lt+1); q[1] = T[1]; }
    1522      748531 :   while (l>lm)
    1523             :   {
    1524      263988 :     GEN zr, zq = Flx_divrem_Barrettspec(r+2+l-lm,lm,mg,T,p,&zr);
    1525      263917 :     long lz = lgpol(zr);
    1526      263861 :     if (pr != ONLY_REM)
    1527             :     {
    1528       27215 :       long lq = lgpol(zq);
    1529      554420 :       for(i=0; i<lq; i++) q[2+l-lm+i] = zq[2+i];
    1530             :     }
    1531     3927775 :     for(i=0; i<lz; i++)   r[2+l-lm+i] = zr[2+i];
    1532      263861 :     l = l-lm+lz;
    1533             :   }
    1534      484543 :   if (pr == ONLY_REM)
    1535             :   {
    1536      363419 :     if (l > lt)
    1537      363403 :       r = Flx_divrem_Barrettspec(r+2,l,mg,T,p,ONLY_REM);
    1538             :     else
    1539          16 :       r = Flx_renormalize(r, l+2);
    1540      363399 :     r[1] = v; return r;
    1541             :   }
    1542      121124 :   if (l > lt)
    1543             :   {
    1544      120090 :     GEN zq = Flx_divrem_Barrettspec(r+2,l,mg,T,p, pr ? &r: NULL);
    1545      120090 :     if (!q) q = zq;
    1546             :     else
    1547             :     {
    1548       15583 :       long lq = lgpol(zq);
    1549      102422 :       for(i=0; i<lq; i++) q[2+i] = zq[2+i];
    1550             :     }
    1551             :   }
    1552        1034 :   else if (pr)
    1553        1115 :     r = Flx_renormalize(r, l+2);
    1554      121124 :   q[1] = v; q = Flx_renormalize(q, lg(q));
    1555      121247 :   if (pr == ONLY_DIVIDES) return lgpol(r)? NULL: q;
    1556      121247 :   if (pr) { r[1] = v; *pr = r; }
    1557      121247 :   return q;
    1558             : }
    1559             : 
    1560             : GEN
    1561    36696927 : Flx_divrem(GEN x, GEN T, ulong p, GEN *pr)
    1562             : {
    1563             :   GEN B, y;
    1564             :   long dy, dx, d;
    1565    36696927 :   if (pr==ONLY_REM) return Flx_rem(x, T, p);
    1566    29306161 :   y = get_Flx_red(T, &B);
    1567    29308014 :   dy = degpol(y); dx = degpol(x); d = dx-dy;
    1568    29304069 :   if (!B && d+3 < get_Fl_threshold(p, Flx_DIVREM_BARRETT_LIMIT,Flx_DIVREM2_BARRETT_LIMIT))
    1569    29182477 :     return Flx_divrem_basecase(x,y,p,pr);
    1570             :   else
    1571             :   {
    1572      121475 :     pari_sp av = avma;
    1573      121475 :     GEN mg = B? B: Flx_invBarrett(y, p);
    1574      121475 :     GEN q1 = Flx_divrem_Barrett(x,mg,y,p,pr);
    1575      121475 :     if (!q1) return gc_NULL(av);
    1576      121475 :     if (!pr || pr==ONLY_DIVIDES) return gerepileuptoleaf(av, q1);
    1577      113854 :     gerepileall(av,2,&q1,pr);
    1578      113854 :     return q1;
    1579             :   }
    1580             : }
    1581             : 
    1582             : GEN
    1583   553351738 : Flx_rem(GEN x, GEN T, ulong p)
    1584             : {
    1585   553351738 :   GEN B, y = get_Flx_red(T, &B);
    1586   553271647 :   long dy = degpol(y), dx = degpol(x), d = dx-dy;
    1587   553156619 :   if (d < 0) return Flx_copy(x);
    1588   470861192 :   if (!B && d+3 < get_Fl_threshold(p, Flx_REM_BARRETT_LIMIT,Flx_REM2_BARRETT_LIMIT))
    1589   470398003 :     return Flx_rem_basecase(x,y,p);
    1590             :   else
    1591             :   {
    1592      363866 :     pari_sp av=avma;
    1593      363866 :     GEN mg = B ? B: Flx_invBarrett(y, p);
    1594      363865 :     GEN r  = Flx_divrem_Barrett(x, mg, y, p, ONLY_REM);
    1595      363858 :     return gerepileuptoleaf(av, r);
    1596             :   }
    1597             : }
    1598             : 
    1599             : /* reduce T mod (X^n - 1, p). Shallow function */
    1600             : GEN
    1601     4936177 : Flx_mod_Xnm1(GEN T, ulong n, ulong p)
    1602             : {
    1603     4936177 :   long i, j, L = lg(T), l = n+2;
    1604             :   GEN S;
    1605     4936177 :   if (L <= l || n & ~LGBITS) return T;
    1606         602 :   S = cgetg(l, t_VECSMALL);
    1607         602 :   S[1] = T[1];
    1608        2324 :   for (i = 2; i < l; i++) S[i] = T[i];
    1609        1848 :   for (j = 2; i < L; i++) {
    1610        1246 :     S[j] = Fl_add(S[j], T[i], p);
    1611        1246 :     if (++j == l) j = 2;
    1612             :   }
    1613         602 :   return Flx_renormalize(S, l);
    1614             : }
    1615             : /* reduce T mod (X^n + 1, p). Shallow function */
    1616             : GEN
    1617        6199 : Flx_mod_Xn1(GEN T, ulong n, ulong p)
    1618             : {
    1619        6199 :   long i, j, L = lg(T), l = n+2;
    1620             :   GEN S;
    1621        6199 :   if (L <= l || n & ~LGBITS) return T;
    1622         553 :   S = cgetg(l, t_VECSMALL);
    1623         553 :   S[1] = T[1];
    1624        2135 :   for (i = 2; i < l; i++) S[i] = T[i];
    1625        1715 :   for (j = 2; i < L; i++) {
    1626        1162 :     S[j] = Fl_sub(S[j], T[i], p);
    1627        1162 :     if (++j == l) j = 2;
    1628             :   }
    1629         553 :   return Flx_renormalize(S, l);
    1630             : }
    1631             : 
    1632             : struct _Flxq {
    1633             :   GEN aut;
    1634             :   GEN T;
    1635             :   ulong p;
    1636             : };
    1637             : 
    1638             : static GEN
    1639           0 : _Flx_divrem(void * E, GEN x, GEN y, GEN *r)
    1640             : {
    1641           0 :   struct _Flxq *D = (struct _Flxq*) E;
    1642           0 :   return Flx_divrem(x, y, D->p, r);
    1643             : }
    1644             : static GEN
    1645      504329 : _Flx_add(void * E, GEN x, GEN y) {
    1646      504329 :   struct _Flxq *D = (struct _Flxq*) E;
    1647      504329 :   return Flx_add(x, y, D->p);
    1648             : }
    1649             : static GEN
    1650     9054565 : _Flx_mul(void *E, GEN x, GEN y) {
    1651     9054565 :   struct _Flxq *D = (struct _Flxq*) E;
    1652     9054565 :   return Flx_mul(x, y, D->p);
    1653             : }
    1654             : static GEN
    1655           0 : _Flx_sqr(void *E, GEN x) {
    1656           0 :   struct _Flxq *D = (struct _Flxq*) E;
    1657           0 :   return Flx_sqr(x, D->p);
    1658             : }
    1659             : 
    1660             : static struct bb_ring Flx_ring = { _Flx_add,_Flx_mul,_Flx_sqr };
    1661             : 
    1662             : GEN
    1663           0 : Flx_digits(GEN x, GEN T, ulong p)
    1664             : {
    1665           0 :   pari_sp av = avma;
    1666             :   struct _Flxq D;
    1667           0 :   long d = degpol(T), n = (lgpol(x)+d-1)/d;
    1668             :   GEN z;
    1669           0 :   D.p = p;
    1670           0 :   z = gen_digits(x,T,n,(void *)&D, &Flx_ring, _Flx_divrem);
    1671           0 :   return gerepileupto(av, z);
    1672             : }
    1673             : 
    1674             : GEN
    1675           0 : FlxV_Flx_fromdigits(GEN x, GEN T, ulong p)
    1676             : {
    1677           0 :   pari_sp av = avma;
    1678             :   struct _Flxq D;
    1679             :   GEN z;
    1680           0 :   D.p = p;
    1681           0 :   z = gen_fromdigits(x,T,(void *)&D, &Flx_ring);
    1682           0 :   return gerepileupto(av, z);
    1683             : }
    1684             : 
    1685             : long
    1686     3147914 : Flx_val(GEN x)
    1687             : {
    1688     3147914 :   long i, l=lg(x);
    1689     3147914 :   if (l==2)  return LONG_MAX;
    1690     3153506 :   for (i=2; i<l && x[i]==0; i++) /*empty*/;
    1691     3147914 :   return i-2;
    1692             : }
    1693             : long
    1694    22111394 : Flx_valrem(GEN x, GEN *Z)
    1695             : {
    1696    22111394 :   long v, i, l=lg(x);
    1697             :   GEN y;
    1698    22111394 :   if (l==2) { *Z = Flx_copy(x); return LONG_MAX; }
    1699    22217789 :   for (i=2; i<l && x[i]==0; i++) /*empty*/;
    1700    22111394 :   v = i-2;
    1701    22111394 :   if (v == 0) { *Z = x; return 0; }
    1702       36616 :   l -= v;
    1703       36616 :   y = cgetg(l, t_VECSMALL); y[1] = x[1];
    1704      144564 :   for (i=2; i<l; i++) y[i] = x[i+v];
    1705       42715 :   *Z = y; return v;
    1706             : }
    1707             : 
    1708             : GEN
    1709     6869607 : Flx_deriv(GEN z, ulong p)
    1710             : {
    1711     6869607 :   long i,l = lg(z)-1;
    1712             :   GEN x;
    1713     6869607 :   if (l < 2) l = 2;
    1714     6869607 :   x = cgetg(l, t_VECSMALL); x[1] = z[1]; z++;
    1715     6869529 :   if (HIGHWORD(l | p))
    1716    34453956 :     for (i=2; i<l; i++) x[i] = Fl_mul((ulong)i-1, z[i], p);
    1717             :   else
    1718    29969730 :     for (i=2; i<l; i++) x[i] = ((i-1) * z[i]) % p;
    1719     6870533 :   return Flx_renormalize(x,l);
    1720             : }
    1721             : 
    1722             : static GEN
    1723        8980 : Flx_integXn(GEN x, long n, ulong p)
    1724             : {
    1725        8980 :   long i, lx = lg(x);
    1726             :   GEN y;
    1727        8980 :   if (lx == 2) return Flx_copy(x);
    1728        7853 :   y = cgetg(lx, t_VECSMALL); y[1] = x[1];
    1729       80681 :   for (i=2; i<lx; i++)
    1730             :   {
    1731       72804 :     ulong xi = uel(x,i);
    1732       72804 :     if (xi == 0)
    1733        6681 :       uel(y,i) = 0;
    1734             :     else
    1735             :     {
    1736       66123 :       ulong j = n+i-1;
    1737       66123 :       ulong d = ugcd(j, xi);
    1738       66111 :       if (d==1)
    1739       35814 :         uel(y,i) = Fl_div(xi, j, p);
    1740             :       else
    1741       30297 :         uel(y,i) = Fl_div(xi/d, j/d, p);
    1742             :     }
    1743             :   }
    1744        7877 :   return Flx_renormalize(y, lx);;
    1745             : }
    1746             : 
    1747             : GEN
    1748           0 : Flx_integ(GEN x, ulong p)
    1749             : {
    1750           0 :   long i, lx = lg(x);
    1751             :   GEN y;
    1752           0 :   if (lx == 2) return Flx_copy(x);
    1753           0 :   y = cgetg(lx+1, t_VECSMALL); y[1] = x[1];
    1754           0 :   uel(y,2) = 0;
    1755           0 :   for (i=3; i<=lx; i++)
    1756           0 :     uel(y,i) = uel(x,i-1) ? Fl_div(uel(x,i-1), (i-2)%p, p): 0UL;
    1757           0 :   return Flx_renormalize(y, lx+1);;
    1758             : }
    1759             : 
    1760             : /* assume p prime */
    1761             : GEN
    1762       11848 : Flx_diff1(GEN P, ulong p)
    1763             : {
    1764       11848 :   return Flx_sub(Flx_translate1(P, p), P, p);
    1765             : }
    1766             : 
    1767             : GEN
    1768       81888 : Flx_deflate(GEN x0, long d)
    1769             : {
    1770             :   GEN z, y, x;
    1771       81888 :   long i,id, dy, dx = degpol(x0);
    1772       81888 :   if (d == 1 || dx <= 0) return Flx_copy(x0);
    1773       74031 :   dy = dx/d;
    1774       74031 :   y = cgetg(dy+3, t_VECSMALL); y[1] = x0[1];
    1775       74031 :   z = y + 2;
    1776       74031 :   x = x0+ 2;
    1777      249372 :   for (i=id=0; i<=dy; i++,id+=d) z[i] = x[id];
    1778       74031 :   return y;
    1779             : }
    1780             : 
    1781             : GEN
    1782       61117 : Flx_inflate(GEN x0, long d)
    1783             : {
    1784       61117 :   long i, id, dy, dx = degpol(x0);
    1785       61108 :   GEN x = x0 + 2, z, y;
    1786       61108 :   if (dx <= 0) return Flx_copy(x0);
    1787       59978 :   dy = dx*d;
    1788       59978 :   y = cgetg(dy+3, t_VECSMALL); y[1] = x0[1];
    1789       59956 :   z = y + 2;
    1790     8733286 :   for (i=0; i<=dy; i++) z[i] = 0;
    1791     4394503 :   for (i=id=0; i<=dx; i++,id+=d) z[id] = x[i];
    1792       59956 :   return y;
    1793             : }
    1794             : 
    1795             : /* write p(X) = a_0(X^k) + X*a_1(X^k) + ... + X^(k-1)*a_{k-1}(X^k) */
    1796             : GEN
    1797      151267 : Flx_splitting(GEN p, long k)
    1798             : {
    1799      151267 :   long n = degpol(p), v = p[1], m, i, j, l;
    1800             :   GEN r;
    1801             : 
    1802      151262 :   m = n/k;
    1803      151262 :   r = cgetg(k+1,t_VEC);
    1804      690560 :   for(i=1; i<=k; i++)
    1805             :   {
    1806      539293 :     gel(r,i) = cgetg(m+3, t_VECSMALL);
    1807      539297 :     mael(r,i,1) = v;
    1808             :   }
    1809     4972477 :   for (j=1, i=0, l=2; i<=n; i++)
    1810             :   {
    1811     4821210 :     mael(r,j,l) = p[2+i];
    1812     4821210 :     if (j==k) { j=1; l++; } else j++;
    1813             :   }
    1814      690564 :   for(i=1; i<=k; i++)
    1815      539332 :     gel(r,i) = Flx_renormalize(gel(r,i),i<j?l+1:l);
    1816      151232 :   return r;
    1817             : }
    1818             : static GEN
    1819      315210 : Flx_halfgcd_basecase(GEN a, GEN b, ulong p)
    1820             : {
    1821      315210 :   pari_sp av=avma;
    1822             :   GEN u,u1,v,v1;
    1823      315210 :   long vx = a[1];
    1824      315210 :   long n = lgpol(a)>>1;
    1825      315206 :   u1 = v = pol0_Flx(vx);
    1826      315200 :   u = v1 = pol1_Flx(vx);
    1827     1391124 :   while (lgpol(b)>n)
    1828             :   {
    1829     1075952 :     GEN r, q = Flx_divrem(a,b,p, &r);
    1830     1075929 :     a = b; b = r; swap(u,u1); swap(v,v1);
    1831     1075929 :     u1 = Flx_sub(u1, Flx_mul(u, q, p), p);
    1832     1075909 :     v1 = Flx_sub(v1, Flx_mul(v, q ,p), p);
    1833     1075931 :     if (gc_needed(av,2))
    1834             :     {
    1835           0 :       if (DEBUGMEM>1) pari_warn(warnmem,"Flx_halfgcd (d = %ld)",degpol(b));
    1836           0 :       gerepileall(av,6, &a,&b,&u1,&v1,&u,&v);
    1837             :     }
    1838             :   }
    1839      315057 :   return gerepilecopy(av, mkmat2(mkcol2(u,u1), mkcol2(v,v1)));
    1840             : }
    1841             : /* ux + vy */
    1842             : static GEN
    1843       16926 : Flx_addmulmul(GEN u, GEN v, GEN x, GEN y, ulong p)
    1844       16926 : { return Flx_add(Flx_mul(u,x, p), Flx_mul(v,y, p), p); }
    1845             : 
    1846             : static GEN
    1847        8460 : FlxM_Flx_mul2(GEN M, GEN x, GEN y, ulong p)
    1848             : {
    1849        8460 :   GEN res = cgetg(3, t_COL);
    1850        8460 :   gel(res, 1) = Flx_addmulmul(gcoeff(M,1,1), gcoeff(M,1,2), x, y, p);
    1851        8460 :   gel(res, 2) = Flx_addmulmul(gcoeff(M,2,1), gcoeff(M,2,2), x, y, p);
    1852        8460 :   return res;
    1853             : }
    1854             : 
    1855             : #if 0
    1856             : static GEN
    1857             : FlxM_mul2_old(GEN M, GEN N, ulong p)
    1858             : {
    1859             :   GEN res = cgetg(3, t_MAT);
    1860             :   gel(res, 1) = FlxM_Flx_mul2(M,gcoeff(N,1,1),gcoeff(N,2,1),p);
    1861             :   gel(res, 2) = FlxM_Flx_mul2(M,gcoeff(N,1,2),gcoeff(N,2,2),p);
    1862             :   return res;
    1863             : }
    1864             : #endif
    1865             : /* A,B are 2x2 matrices, Flx entries. Return A x B using Strassen 7M formula */
    1866             : static GEN
    1867        1341 : FlxM_mul2(GEN A, GEN B, ulong p)
    1868             : {
    1869        1341 :   GEN A11=gcoeff(A,1,1),A12=gcoeff(A,1,2), B11=gcoeff(B,1,1),B12=gcoeff(B,1,2);
    1870        1341 :   GEN A21=gcoeff(A,2,1),A22=gcoeff(A,2,2), B21=gcoeff(B,2,1),B22=gcoeff(B,2,2);
    1871        1341 :   GEN M1 = Flx_mul(Flx_add(A11,A22, p), Flx_add(B11,B22, p), p);
    1872        1341 :   GEN M2 = Flx_mul(Flx_add(A21,A22, p), B11, p);
    1873        1341 :   GEN M3 = Flx_mul(A11, Flx_sub(B12,B22, p), p);
    1874        1341 :   GEN M4 = Flx_mul(A22, Flx_sub(B21,B11, p), p);
    1875        1341 :   GEN M5 = Flx_mul(Flx_add(A11,A12, p), B22, p);
    1876        1341 :   GEN M6 = Flx_mul(Flx_sub(A21,A11, p), Flx_add(B11,B12, p), p);
    1877        1341 :   GEN M7 = Flx_mul(Flx_sub(A12,A22, p), Flx_add(B21,B22, p), p);
    1878        1341 :   GEN T1 = Flx_add(M1,M4, p), T2 = Flx_sub(M7,M5, p);
    1879        1341 :   GEN T3 = Flx_sub(M1,M2, p), T4 = Flx_add(M3,M6, p);
    1880        1341 :   retmkmat2(mkcol2(Flx_add(T1,T2, p), Flx_add(M2,M4, p)),
    1881             :             mkcol2(Flx_add(M3,M5, p), Flx_add(T3,T4, p)));
    1882             : }
    1883             : 
    1884             : /* Return [0,1;1,-q]*M */
    1885             : static GEN
    1886        1338 : Flx_FlxM_qmul(GEN q, GEN M, ulong p)
    1887             : {
    1888        1338 :   GEN u, v, res = cgetg(3, t_MAT);
    1889        1338 :   u = Flx_sub(gcoeff(M,1,1), Flx_mul(gcoeff(M,2,1), q, p), p);
    1890        1338 :   gel(res,1) = mkcol2(gcoeff(M,2,1), u);
    1891        1338 :   v = Flx_sub(gcoeff(M,1,2), Flx_mul(gcoeff(M,2,2), q, p), p);
    1892        1338 :   gel(res,2) = mkcol2(gcoeff(M,2,2), v);
    1893        1338 :   return res;
    1894             : }
    1895             : 
    1896             : static GEN
    1897           3 : matid2_FlxM(long v)
    1898             : {
    1899           3 :   return mkmat2(mkcol2(pol1_Flx(v),pol0_Flx(v)),
    1900             :                 mkcol2(pol0_Flx(v),pol1_Flx(v)));
    1901             : }
    1902             : 
    1903             : static GEN
    1904        8433 : Flx_halfgcd_split(GEN x, GEN y, ulong p)
    1905             : {
    1906        8433 :   pari_sp av=avma;
    1907             :   GEN R, S, V;
    1908             :   GEN y1, r, q;
    1909        8433 :   long l = lgpol(x), n = l>>1, k;
    1910        8433 :   if (lgpol(y)<=n) return matid2_FlxM(x[1]);
    1911        8433 :   R = Flx_halfgcd(Flx_shift(x,-n),Flx_shift(y,-n),p);
    1912        8433 :   V = FlxM_Flx_mul2(R,x,y,p); y1 = gel(V,2);
    1913        8433 :   if (lgpol(y1)<=n) return gerepilecopy(av, R);
    1914        1338 :   q = Flx_divrem(gel(V,1), y1, p, &r);
    1915        1338 :   k = 2*n-degpol(y1);
    1916        1338 :   S = Flx_halfgcd(Flx_shift(y1,-k), Flx_shift(r,-k),p);
    1917        1338 :   return gerepileupto(av, FlxM_mul2(S,Flx_FlxM_qmul(q,R,p),p));
    1918             : }
    1919             : 
    1920             : /* Return M in GL_2(Fl[X]) such that:
    1921             : if [a',b']~=M*[a,b]~ then degpol(a')>= (lgpol(a)>>1) >degpol(b')
    1922             : */
    1923             : 
    1924             : static GEN
    1925      323648 : Flx_halfgcd_i(GEN x, GEN y, ulong p)
    1926             : {
    1927      323648 :   if (lgpol(x) < get_Fl_threshold(p, Flx_HALFGCD_LIMIT, Flx_HALFGCD2_LIMIT))
    1928      315211 :     return Flx_halfgcd_basecase(x,y,p);
    1929        8433 :   return Flx_halfgcd_split(x,y,p);
    1930             : }
    1931             : 
    1932             : GEN
    1933      323649 : Flx_halfgcd(GEN x, GEN y, ulong p)
    1934             : {
    1935             :   pari_sp av;
    1936             :   GEN M,q,r;
    1937      323649 :   long lx=lgpol(x), ly=lgpol(y);
    1938      323647 :   if (!lx)
    1939             :   {
    1940           0 :       long v = x[1];
    1941           0 :       retmkmat2(mkcol2(pol0_Flx(v),pol1_Flx(v)),
    1942             :                 mkcol2(pol1_Flx(v),pol0_Flx(v)));
    1943             :   }
    1944      323647 :   if (ly < lx) return Flx_halfgcd_i(x,y,p);
    1945        3807 :   av = avma;
    1946        3807 :   q = Flx_divrem(y,x,p,&r);
    1947        3807 :   M = Flx_halfgcd_i(x,r,p);
    1948        3807 :   gcoeff(M,1,1) = Flx_sub(gcoeff(M,1,1), Flx_mul(q, gcoeff(M,1,2), p), p);
    1949        3807 :   gcoeff(M,2,1) = Flx_sub(gcoeff(M,2,1), Flx_mul(q, gcoeff(M,2,2), p), p);
    1950        3807 :   return gerepilecopy(av, M);
    1951             : }
    1952             : 
    1953             : /*Do not garbage collect*/
    1954             : static GEN
    1955    37501225 : Flx_gcd_basecase(GEN a, GEN b, ulong p)
    1956             : {
    1957    37501225 :   pari_sp av = avma;
    1958    37501225 :   ulong iter = 0;
    1959    37501225 :   if (lg(b) > lg(a)) swap(a, b);
    1960   144871877 :   while (lgpol(b))
    1961             :   {
    1962   107138859 :     GEN c = Flx_rem(a,b,p);
    1963   107370652 :     iter++; a = b; b = c;
    1964   107370652 :     if (gc_needed(av,2))
    1965             :     {
    1966           0 :       if (DEBUGMEM>1) pari_warn(warnmem,"Flx_gcd (d = %ld)",degpol(c));
    1967           0 :       gerepileall(av,2, &a,&b);
    1968             :     }
    1969             :   }
    1970    37427131 :   return iter < 2 ? Flx_copy(a) : a;
    1971             : }
    1972             : 
    1973             : GEN
    1974    38316593 : Flx_gcd(GEN x, GEN y, ulong p)
    1975             : {
    1976    38316593 :   pari_sp av = avma;
    1977             :   long lim;
    1978    38316593 :   if (!lgpol(x)) return Flx_copy(y);
    1979    37502420 :   lim = get_Fl_threshold(p, Flx_GCD_LIMIT, Flx_GCD2_LIMIT);
    1980    37502096 :   while (lgpol(y) >= lim)
    1981             :   {
    1982             :     GEN c;
    1983          24 :     if (lgpol(y)<=(lgpol(x)>>1))
    1984             :     {
    1985           0 :       GEN r = Flx_rem(x, y, p);
    1986           0 :       x = y; y = r;
    1987             :     }
    1988          24 :     c = FlxM_Flx_mul2(Flx_halfgcd(x,y, p), x, y, p);
    1989          24 :     x = gel(c,1); y = gel(c,2);
    1990          24 :     if (gc_needed(av,2))
    1991             :     {
    1992           0 :       if (DEBUGMEM>1) pari_warn(warnmem,"Flx_gcd (y = %ld)",degpol(y));
    1993           0 :       gerepileall(av,2,&x,&y);
    1994             :     }
    1995             :   }
    1996    37496512 :   return gerepileuptoleaf(av, Flx_gcd_basecase(x,y,p));
    1997             : }
    1998             : 
    1999             : int
    2000     3773697 : Flx_is_squarefree(GEN z, ulong p)
    2001             : {
    2002     3773697 :   pari_sp av = avma;
    2003     3773697 :   GEN d = Flx_gcd(z, Flx_deriv(z,p) , p);
    2004     3773693 :   return gc_bool(av, degpol(d) == 0);
    2005             : }
    2006             : 
    2007             : static long
    2008      139118 : Flx_is_smooth_squarefree(GEN f, long r, ulong p)
    2009             : {
    2010      139118 :   pari_sp av = avma;
    2011             :   long i;
    2012      139118 :   GEN sx = polx_Flx(f[1]), a = sx;
    2013      138900 :   for(i=1;;i++)
    2014             :   {
    2015      592627 :     if (degpol(f)<=r) return gc_long(av,1);
    2016      566626 :     a = Flxq_powu(Flx_rem(a,f,p), p, f, p);
    2017      570842 :     if (Flx_equal(a, sx)) return gc_long(av,1);
    2018      566751 :     if (i==r) return gc_long(av,0);
    2019      455366 :     f = Flx_div(f, Flx_gcd(Flx_sub(a,sx,p),f,p),p);
    2020             :   }
    2021             : }
    2022             : 
    2023             : static long
    2024        9086 : Flx_is_l_pow(GEN x, ulong p)
    2025             : {
    2026        9086 :   ulong i, lx = lgpol(x);
    2027       18311 :   for (i=1; i<lx; i++)
    2028       16356 :     if (x[i+2] && i%p) return 0;
    2029        1955 :   return 1;
    2030             : }
    2031             : 
    2032             : int
    2033      139138 : Flx_is_smooth(GEN g, long r, ulong p)
    2034             : {
    2035             :   while (1)
    2036        9086 :   {
    2037      139138 :     GEN f = Flx_gcd(g, Flx_deriv(g, p), p);
    2038      139046 :     if (!Flx_is_smooth_squarefree(Flx_div(g, f, p), r, p))
    2039      111359 :       return 0;
    2040       27898 :     if (degpol(f)==0) return 1;
    2041        9068 :     g = Flx_is_l_pow(f,p) ? Flx_deflate(f, p): f;
    2042             :   }
    2043             : }
    2044             : 
    2045             : static GEN
    2046     4246297 : Flx_extgcd_basecase(GEN a, GEN b, ulong p, GEN *ptu, GEN *ptv)
    2047             : {
    2048     4246297 :   pari_sp av=avma;
    2049             :   GEN u,v,d,d1,v1;
    2050     4246297 :   long vx = a[1];
    2051     4246297 :   d = a; d1 = b;
    2052     4246297 :   v = pol0_Flx(vx); v1 = pol1_Flx(vx);
    2053    21629845 :   while (lgpol(d1))
    2054             :   {
    2055    17383779 :     GEN r, q = Flx_divrem(d,d1,p, &r);
    2056    17384164 :     v = Flx_sub(v,Flx_mul(q,v1,p),p);
    2057    17383646 :     u=v; v=v1; v1=u;
    2058    17383646 :     u=r; d=d1; d1=u;
    2059    17383646 :     if (gc_needed(av,2))
    2060             :     {
    2061           0 :       if (DEBUGMEM>1) pari_warn(warnmem,"Flx_extgcd (d = %ld)",degpol(d));
    2062           0 :       gerepileall(av,5, &d,&d1,&u,&v,&v1);
    2063             :     }
    2064             :   }
    2065     4245484 :   if (ptu) *ptu = Flx_div(Flx_sub(d, Flx_mul(b,v,p), p), a, p);
    2066     4246142 :   *ptv = v; return d;
    2067             : }
    2068             : 
    2069             : static GEN
    2070           3 : Flx_extgcd_halfgcd(GEN x, GEN y, ulong p, GEN *ptu, GEN *ptv)
    2071             : {
    2072           3 :   pari_sp av=avma;
    2073           3 :   GEN u,v,R = matid2_FlxM(x[1]);
    2074           3 :   long lim = get_Fl_threshold(p, Flx_EXTGCD_LIMIT, Flx_EXTGCD2_LIMIT);
    2075           6 :   while (lgpol(y) >= lim)
    2076             :   {
    2077             :     GEN M, c;
    2078           3 :     if (lgpol(y)<=(lgpol(x)>>1))
    2079             :     {
    2080           0 :       GEN r, q = Flx_divrem(x, y, p, &r);
    2081           0 :       x = y; y = r;
    2082           0 :       R = Flx_FlxM_qmul(q, R, p);
    2083             :     }
    2084           3 :     M = Flx_halfgcd(x,y, p);
    2085           3 :     c = FlxM_Flx_mul2(M, x,y, p);
    2086           3 :     R = FlxM_mul2(M, R, p);
    2087           3 :     x = gel(c,1); y = gel(c,2);
    2088           3 :     gerepileall(av,3,&x,&y,&R);
    2089             :   }
    2090           3 :   y = Flx_extgcd_basecase(x,y,p,&u,&v);
    2091           3 :   if (ptu) *ptu = Flx_addmulmul(u,v,gcoeff(R,1,1),gcoeff(R,2,1),p);
    2092           3 :   *ptv = Flx_addmulmul(u,v,gcoeff(R,1,2),gcoeff(R,2,2),p);
    2093           3 :   return y;
    2094             : }
    2095             : 
    2096             : /* x and y in Z[X], return lift(gcd(x mod p, y mod p)). Set u and v st
    2097             :  * ux + vy = gcd (mod p) */
    2098             : GEN
    2099     4246286 : Flx_extgcd(GEN x, GEN y, ulong p, GEN *ptu, GEN *ptv)
    2100             : {
    2101             :   GEN d;
    2102     4246286 :   pari_sp ltop=avma;
    2103     4246286 :   long lim = get_Fl_threshold(p, Flx_EXTGCD_LIMIT, Flx_EXTGCD2_LIMIT);
    2104     4246289 :   if (lgpol(y) >= lim)
    2105           3 :     d = Flx_extgcd_halfgcd(x, y, p, ptu, ptv);
    2106             :   else
    2107     4246279 :     d = Flx_extgcd_basecase(x, y, p, ptu, ptv);
    2108     4246144 :   gerepileall(ltop,ptu?3:2,&d,ptv,ptu);
    2109     4246438 :   return d;
    2110             : }
    2111             : 
    2112             : ulong
    2113     2314732 : Flx_resultant(GEN a, GEN b, ulong p)
    2114             : {
    2115             :   long da,db,dc,cnt;
    2116     2314732 :   ulong lb, res = 1UL;
    2117             :   pari_sp av;
    2118             :   GEN c;
    2119             : 
    2120     2314732 :   if (lgpol(a)==0 || lgpol(b)==0) return 0;
    2121     2313256 :   da = degpol(a);
    2122     2313245 :   db = degpol(b);
    2123     2313267 :   if (db > da)
    2124             :   {
    2125       97436 :     swapspec(a,b, da,db);
    2126       97436 :     if (both_odd(da,db)) res = p-res;
    2127             :   }
    2128     2215831 :   else if (!da) return 1; /* = res * a[2] ^ db, since 0 <= db <= da = 0 */
    2129     2313267 :   cnt = 0; av = avma;
    2130    31889193 :   while (db)
    2131             :   {
    2132    29590159 :     lb = b[db+2];
    2133    29590159 :     c = Flx_rem(a,b, p);
    2134    29480017 :     a = b; b = c; dc = degpol(c);
    2135    29480650 :     if (dc < 0) return gc_long(av,0);
    2136             : 
    2137    29480422 :     if (both_odd(da,db)) res = p - res;
    2138    29499849 :     if (lb != 1) res = Fl_mul(res, Fl_powu(lb, da - dc, p), p);
    2139    29554533 :     if (++cnt == 100) { cnt = 0; gerepileall(av, 2, &a, &b); }
    2140    29575926 :     da = db; /* = degpol(a) */
    2141    29575926 :     db = dc; /* = degpol(b) */
    2142             :   }
    2143     2299034 :   return gc_ulong(av, Fl_mul(res, Fl_powu(b[2], da, p), p));
    2144             : }
    2145             : 
    2146             : /* If resultant is 0, *ptU and *ptV are not set */
    2147             : ulong
    2148           0 : Flx_extresultant(GEN a, GEN b, ulong p, GEN *ptU, GEN *ptV)
    2149             : {
    2150           0 :   GEN z,q,u,v, x = a, y = b;
    2151           0 :   ulong lb, res = 1UL;
    2152           0 :   pari_sp av = avma;
    2153             :   long dx, dy, dz;
    2154           0 :   long vs=a[1];
    2155             : 
    2156           0 :   dx = degpol(x);
    2157           0 :   dy = degpol(y);
    2158           0 :   if (dy > dx)
    2159             :   {
    2160           0 :     swap(x,y); lswap(dx,dy); pswap(ptU, ptV);
    2161           0 :     a = x; b = y;
    2162           0 :     if (both_odd(dx,dy)) res = p-res;
    2163             :   }
    2164             :   /* dy <= dx */
    2165           0 :   if (dy < 0) return 0;
    2166             : 
    2167           0 :   u = pol0_Flx(vs);
    2168           0 :   v = pol1_Flx(vs); /* v = 1 */
    2169           0 :   while (dy)
    2170             :   { /* b u = x (a), b v = y (a) */
    2171           0 :     lb = y[dy+2];
    2172           0 :     q = Flx_divrem(x,y, p, &z);
    2173           0 :     x = y; y = z; /* (x,y) = (y, x - q y) */
    2174           0 :     dz = degpol(z); if (dz < 0) return gc_ulong(av,0);
    2175           0 :     z = Flx_sub(u, Flx_mul(q,v, p), p);
    2176           0 :     u = v; v = z; /* (u,v) = (v, u - q v) */
    2177             : 
    2178           0 :     if (both_odd(dx,dy)) res = p - res;
    2179           0 :     if (lb != 1) res = Fl_mul(res, Fl_powu(lb, dx-dz, p), p);
    2180           0 :     dx = dy; /* = degpol(x) */
    2181           0 :     dy = dz; /* = degpol(y) */
    2182             :   }
    2183           0 :   res = Fl_mul(res, Fl_powu(y[2], dx, p), p);
    2184           0 :   lb = Fl_mul(res, Fl_inv(y[2],p), p);
    2185           0 :   v = gerepileuptoleaf(av, Flx_Fl_mul(v, lb, p));
    2186           0 :   av = avma;
    2187           0 :   u = Flx_sub(Fl_to_Flx(res,vs), Flx_mul(b,v,p), p);
    2188           0 :   u = gerepileuptoleaf(av, Flx_div(u,a,p)); /* = (res - b v) / a */
    2189           0 :   *ptU = u;
    2190           0 :   *ptV = v; return res;
    2191             : }
    2192             : 
    2193             : ulong
    2194    31476264 : Flx_eval_powers_pre(GEN x, GEN y, ulong p, ulong pi)
    2195             : {
    2196    31476264 :   ulong l0, l1, h0, h1, v1,  i = 1, lx = lg(x)-1;
    2197             :   LOCAL_OVERFLOW;
    2198             :   LOCAL_HIREMAINDER;
    2199    31476264 :   x++;
    2200             : 
    2201    31476264 :   if (lx == 1)
    2202     3476573 :     return 0;
    2203    27999691 :   l1 = mulll(uel(x,i), uel(y,i)); h1 = hiremainder; v1 = 0;
    2204    64550984 :   while (++i < lx) {
    2205    36551293 :     l0 = mulll(uel(x,i), uel(y,i)); h0 = hiremainder;
    2206    36551293 :     l1 = addll(l0, l1); h1 = addllx(h0, h1); v1 += overflow;
    2207             :   }
    2208    27999691 :   if (v1 == 0) return remll_pre(h1, l1, p, pi);
    2209       55405 :   else return remlll_pre(v1, h1, l1, p, pi);
    2210             : }
    2211             : 
    2212             : INLINE ulong
    2213     4160215 : Flx_eval_pre_i(GEN x, ulong y, ulong p, ulong pi)
    2214             : {
    2215             :   ulong p1;
    2216     4160215 :   long i=lg(x)-1;
    2217     4160215 :   if (i<=2)
    2218     2441972 :     return (i==2)? x[2]: 0;
    2219     1718243 :   p1 = x[i];
    2220     6836017 :   for (i--; i>=2; i--)
    2221     5116506 :     p1 = Fl_addmul_pre(uel(x, i), p1, y, p, pi);
    2222     1719511 :   return p1;
    2223             : }
    2224             : 
    2225             : ulong
    2226     4241012 : Flx_eval_pre(GEN x, ulong y, ulong p, ulong pi)
    2227             : {
    2228     4241012 :   if (degpol(x) > 15)
    2229             :   {
    2230       80920 :     pari_sp av = avma;
    2231       80920 :     GEN v = Fl_powers_pre(y, degpol(x), p, pi);
    2232       80921 :     ulong r =  Flx_eval_powers_pre(x, v, p, pi);
    2233       80920 :     return gc_ulong(av,r);
    2234             :   }
    2235             :   else
    2236     4159886 :     return Flx_eval_pre_i(x, y, p, pi);
    2237             : }
    2238             : 
    2239             : ulong
    2240     4236772 : Flx_eval(GEN x, ulong y, ulong p)
    2241             : {
    2242     4236772 :   return Flx_eval_pre(x, y, p, get_Fl_red(p));
    2243             : }
    2244             : 
    2245             : ulong
    2246        3073 : Flv_prod_pre(GEN x, ulong p, ulong pi)
    2247             : {
    2248        3073 :   pari_sp ltop = avma;
    2249             :   GEN v;
    2250        3073 :   long i,k,lx = lg(x);
    2251        3073 :   if (lx == 1) return 1UL;
    2252        3073 :   if (lx == 2) return uel(x,1);
    2253        2884 :   v = cgetg(1+(lx << 1), t_VECSMALL);
    2254        2884 :   k = 1;
    2255       27244 :   for (i=1; i<lx-1; i+=2)
    2256       24360 :     uel(v,k++) = Fl_mul_pre(uel(x,i), uel(x,i+1), p, pi);
    2257        2884 :   if (i < lx) uel(v,k++) = uel(x,i);
    2258       12964 :   while (k > 2)
    2259             :   {
    2260       10080 :     lx = k; k = 1;
    2261       34440 :     for (i=1; i<lx-1; i+=2)
    2262       24360 :       uel(v,k++) = Fl_mul_pre(uel(v,i), uel(v,i+1), p, pi);
    2263       10080 :     if (i < lx) uel(v,k++) = uel(v,i);
    2264             :   }
    2265        2884 :   return gc_ulong(ltop, uel(v,1));
    2266             : }
    2267             : 
    2268             : ulong
    2269           0 : Flv_prod(GEN v, ulong p)
    2270             : {
    2271           0 :   return Flv_prod_pre(v, p, get_Fl_red(p));
    2272             : }
    2273             : 
    2274             : GEN
    2275           0 : FlxV_prod(GEN V, ulong p)
    2276             : {
    2277             :   struct _Flxq D;
    2278           0 :   D.T = NULL; D.aut = NULL; D.p = p;
    2279           0 :   return gen_product(V, (void *)&D, &_Flx_mul);
    2280             : }
    2281             : 
    2282             : /* compute prod (x - a[i]) */
    2283             : GEN
    2284      620017 : Flv_roots_to_pol(GEN a, ulong p, long vs)
    2285             : {
    2286             :   struct _Flxq D;
    2287      620017 :   long i,k,lx = lg(a);
    2288             :   GEN p1;
    2289      620017 :   if (lx == 1) return pol1_Flx(vs);
    2290      620017 :   p1 = cgetg(lx, t_VEC);
    2291    10230120 :   for (k=1,i=1; i<lx-1; i+=2)
    2292     9610276 :     gel(p1,k++) = mkvecsmall4(vs, Fl_mul(a[i], a[i+1], p),
    2293     9610615 :                               Fl_neg(Fl_add(a[i],a[i+1],p),p), 1);
    2294      619505 :   if (i < lx)
    2295       52421 :     gel(p1,k++) = mkvecsmall3(vs, Fl_neg(a[i],p), 1);
    2296      619505 :   D.T = NULL; D.aut = NULL; D.p = p;
    2297      619505 :   setlg(p1, k); return gen_product(p1, (void *)&D, _Flx_mul);
    2298             : }
    2299             : 
    2300             : /* set v[i] = w[i]^{-1}; may be called with w = v, suitable for "large" p */
    2301             : INLINE void
    2302    10363075 : Flv_inv_pre_indir(GEN w, GEN v, ulong p, ulong pi)
    2303             : {
    2304    10363075 :   pari_sp av = avma;
    2305    10363075 :   long n = lg(w), i;
    2306             :   ulong u;
    2307             :   GEN c;
    2308             : 
    2309    10363075 :   if (n == 1) return;
    2310    10363075 :   c = cgetg(n, t_VECSMALL); c[1] = w[1];
    2311    56922723 :   for (i = 2; i < n; ++i) c[i] = Fl_mul_pre(w[i], c[i-1], p, pi);
    2312    10363073 :   i = n-1; u = Fl_inv(c[i], p);
    2313    56922686 :   for ( ; i > 1; --i)
    2314             :   {
    2315    46559609 :     ulong t = Fl_mul_pre(u, c[i-1], p, pi);
    2316    46559610 :     u = Fl_mul_pre(u, w[i], p, pi); v[i] = t;
    2317             :   }
    2318    10363077 :   v[1] = u; set_avma(av);
    2319             : }
    2320             : 
    2321             : void
    2322    10322595 : Flv_inv_pre_inplace(GEN v, ulong p, ulong pi) { Flv_inv_pre_indir(v,v, p, pi); }
    2323             : 
    2324             : GEN
    2325       10678 : Flv_inv_pre(GEN w, ulong p, ulong pi)
    2326       10678 : { GEN v = cgetg(lg(w), t_VECSMALL); Flv_inv_pre_indir(w, v, p, pi); return v; }
    2327             : 
    2328             : /* set v[i] = w[i]^{-1}; may be called with w = v, suitable for SMALL_ULONG p */
    2329             : INLINE void
    2330       32934 : Flv_inv_indir(GEN w, GEN v, ulong p)
    2331             : {
    2332       32934 :   pari_sp av = avma;
    2333       32934 :   long n = lg(w), i;
    2334             :   ulong u;
    2335             :   GEN c;
    2336             : 
    2337       32934 :   if (n == 1) return;
    2338       32934 :   c = cgetg(n, t_VECSMALL); c[1] = w[1];
    2339      429818 :   for (i = 2; i < n; ++i) c[i] = Fl_mul(w[i], c[i-1], p);
    2340       32935 :   i = n-1; u = Fl_inv(c[i], p);
    2341      429902 :   for ( ; i > 1; --i)
    2342             :   {
    2343      396964 :     ulong t = Fl_mul(u, c[i-1], p);
    2344      396970 :     u = Fl_mul(u, w[i], p); v[i] = t;
    2345             :   }
    2346       32938 :   v[1] = u; set_avma(av);
    2347             : }
    2348             : static void
    2349       62736 : Flv_inv_i(GEN v, GEN w, ulong p)
    2350             : {
    2351       62736 :   if (SMALL_ULONG(p)) Flv_inv_indir(w, v, p);
    2352       29801 :   else Flv_inv_pre_indir(w, v, p, get_Fl_red(p));
    2353       62740 : }
    2354             : void
    2355         221 : Flv_inv_inplace(GEN v, ulong p) { Flv_inv_i(v, v, p); }
    2356             : GEN
    2357       62519 : Flv_inv(GEN w, ulong p)
    2358       62519 : { GEN v = cgetg(lg(w), t_VECSMALL); Flv_inv_i(v, w, p); return v; }
    2359             : 
    2360             : GEN
    2361    28663271 : Flx_div_by_X_x(GEN a, ulong x, ulong p, ulong *rem)
    2362             : {
    2363    28663271 :   long l = lg(a), i;
    2364             :   GEN a0, z0, z;
    2365    28663271 :   if (l <= 3)
    2366             :   {
    2367           0 :     if (rem) *rem = l == 2? 0: a[2];
    2368           0 :     return zero_Flx(a[1]);
    2369             :   }
    2370    28663271 :   z = cgetg(l-1,t_VECSMALL); z[1] = a[1];
    2371    28541542 :   a0 = a + l-1;
    2372    28541542 :   z0 = z + l-2; *z0 = *a0--;
    2373    28541542 :   if (SMALL_ULONG(p))
    2374             :   {
    2375    69940499 :     for (i=l-3; i>1; i--) /* z[i] = (a[i+1] + x*z[i+1]) % p */
    2376             :     {
    2377    52450455 :       ulong t = (*a0-- + x *  *z0--) % p;
    2378    52450455 :       *z0 = (long)t;
    2379             :     }
    2380    17490044 :     if (rem) *rem = (*a0 + x *  *z0) % p;
    2381             :   }
    2382             :   else
    2383             :   {
    2384    43398435 :     for (i=l-3; i>1; i--)
    2385             :     {
    2386    32301978 :       ulong t = Fl_add((ulong)*a0--, Fl_mul(x, *z0--, p), p);
    2387    32346937 :       *z0 = (long)t;
    2388             :     }
    2389    11096457 :     if (rem) *rem = Fl_add((ulong)*a0, Fl_mul(x, *z0, p), p);
    2390             :   }
    2391    28610533 :   return z;
    2392             : }
    2393             : 
    2394             : /* xa, ya = t_VECSMALL */
    2395             : static GEN
    2396       61397 : Flv_producttree(GEN xa, GEN s, ulong p, long vs)
    2397             : {
    2398       61397 :   long n = lg(xa)-1;
    2399       61397 :   long m = n==1 ? 1: expu(n-1)+1;
    2400       61396 :   long i, j, k, ls = lg(s);
    2401       61396 :   GEN T = cgetg(m+1, t_VEC);
    2402       61388 :   GEN t = cgetg(ls, t_VEC);
    2403      718715 :   for (j=1, k=1; j<ls; k+=s[j++])
    2404      657204 :     gel(t, j) = s[j] == 1 ?
    2405      657329 :              mkvecsmall3(vs, Fl_neg(xa[k], p), 1):
    2406      225241 :              mkvecsmall4(vs, Fl_mul(xa[k], xa[k+1], p),
    2407      225234 :                  Fl_neg(Fl_add(xa[k],xa[k+1],p),p), 1);
    2408       61386 :   gel(T,1) = t;
    2409      231671 :   for (i=2; i<=m; i++)
    2410             :   {
    2411      170320 :     GEN u = gel(T, i-1);
    2412      170320 :     long n = lg(u)-1;
    2413      170320 :     GEN t = cgetg(((n+1)>>1)+1, t_VEC);
    2414      766083 :     for (j=1, k=1; k<n; j++, k+=2)
    2415      595798 :       gel(t, j) = Flx_mul(gel(u, k), gel(u, k+1), p);
    2416      170285 :     gel(T, i) = t;
    2417             :   }
    2418       61351 :   return T;
    2419             : }
    2420             : 
    2421             : static GEN
    2422       61389 : Flx_Flv_multieval_tree(GEN P, GEN xa, GEN T, ulong p)
    2423             : {
    2424             :   long i,j,k;
    2425       61389 :   long m = lg(T)-1;
    2426       61389 :   GEN R = cgetg(lg(xa), t_VECSMALL);
    2427       61384 :   GEN Tp = cgetg(m+1, t_VEC), t;
    2428       61377 :   gel(Tp, m) = mkvec(P);
    2429      231697 :   for (i=m-1; i>=1; i--)
    2430             :   {
    2431      170309 :     GEN u = gel(T, i), v = gel(Tp, i+1);
    2432      170309 :     long n = lg(u)-1;
    2433      170309 :     t = cgetg(n+1, t_VEC);
    2434      766010 :     for (j=1, k=1; k<n; j++, k+=2)
    2435             :     {
    2436      595691 :       gel(t, k)   = Flx_rem(gel(v, j), gel(u, k), p);
    2437      595686 :       gel(t, k+1) = Flx_rem(gel(v, j), gel(u, k+1), p);
    2438             :     }
    2439      170319 :     gel(Tp, i) = t;
    2440             :   }
    2441             :   {
    2442       61388 :     GEN u = gel(T, i+1), v = gel(Tp, i+1);
    2443       61388 :     long n = lg(u)-1;
    2444      718958 :     for (j=1, k=1; j<=n; j++)
    2445             :     {
    2446      657529 :       long c, d = degpol(gel(u,j));
    2447     1540158 :       for (c=1; c<=d; c++, k++) R[k] = Flx_eval(gel(v, j), xa[k], p);
    2448             :     }
    2449       61429 :     return gc_const((pari_sp)R, R);
    2450             :   }
    2451             : }
    2452             : 
    2453             : static GEN
    2454      758349 : FlvV_polint_tree(GEN T, GEN R, GEN s, GEN xa, GEN ya, ulong p, long vs)
    2455             : {
    2456      758349 :   pari_sp av = avma;
    2457      758349 :   long m = lg(T)-1;
    2458      758349 :   long i, j, k, ls = lg(s);
    2459      758349 :   GEN Tp = cgetg(m+1, t_VEC);
    2460      757631 :   GEN t = cgetg(ls, t_VEC);
    2461    13151360 :   for (j=1, k=1; j<ls; k+=s[j++])
    2462    12393831 :     if (s[j]==2)
    2463             :     {
    2464     4240739 :       ulong a = Fl_mul(ya[k], R[k], p);
    2465     4242475 :       ulong b = Fl_mul(ya[k+1], R[k+1], p);
    2466     4251367 :       gel(t, j) = mkvecsmall3(vs, Fl_neg(Fl_add(Fl_mul(xa[k], b, p ),
    2467     4248407 :                   Fl_mul(xa[k+1], a, p), p), p), Fl_add(a, b, p));
    2468     4242059 :       gel(t, j) = Flx_renormalize(gel(t, j), 4);
    2469             :     }
    2470             :     else
    2471     8153092 :       gel(t, j) = Fl_to_Flx(Fl_mul(ya[k], R[k], p), vs);
    2472      757529 :   gel(Tp, 1) = t;
    2473     3364190 :   for (i=2; i<=m; i++)
    2474             :   {
    2475     2606970 :     GEN u = gel(T, i-1);
    2476     2606970 :     GEN t = cgetg(lg(gel(T,i)), t_VEC);
    2477     2603776 :     GEN v = gel(Tp, i-1);
    2478     2603776 :     long n = lg(v)-1;
    2479    14199341 :     for (j=1, k=1; k<n; j++, k+=2)
    2480    11604766 :       gel(t, j) = Flx_add(Flx_mul(gel(u, k), gel(v, k+1), p),
    2481    11592680 :                           Flx_mul(gel(u, k+1), gel(v, k), p), p);
    2482     2606661 :     gel(Tp, i) = t;
    2483             :   }
    2484      757220 :   return gerepileuptoleaf(av, gmael(Tp,m,1));
    2485             : }
    2486             : 
    2487             : GEN
    2488           0 : Flx_Flv_multieval(GEN P, GEN xa, ulong p)
    2489             : {
    2490           0 :   pari_sp av = avma;
    2491           0 :   GEN s = producttree_scheme(lg(xa)-1);
    2492           0 :   GEN T = Flv_producttree(xa, s, p, P[1]);
    2493           0 :   return gerepileuptoleaf(av, Flx_Flv_multieval_tree(P, xa, T, p));
    2494             : }
    2495             : 
    2496             : static GEN
    2497           0 : FlxV_Flv_multieval_tree(GEN x, GEN xa, GEN T, ulong p)
    2498           0 : { pari_APPLY_same(Flx_Flv_multieval_tree(gel(x,i), xa, T, p)) }
    2499             : 
    2500             : GEN
    2501           0 : FlxV_Flv_multieval(GEN P, GEN xa, ulong p)
    2502             : {
    2503           0 :   pari_sp av = avma;
    2504           0 :   GEN s = producttree_scheme(lg(xa)-1);
    2505           0 :   GEN T = Flv_producttree(xa, s, p, P[1]);
    2506           0 :   return gerepileupto(av, FlxV_Flv_multieval_tree(P, xa, T, p));
    2507             : }
    2508             : 
    2509             : GEN
    2510       17785 : Flv_polint(GEN xa, GEN ya, ulong p, long vs)
    2511             : {
    2512       17785 :   pari_sp av = avma;
    2513       17785 :   GEN s = producttree_scheme(lg(xa)-1);
    2514       17785 :   GEN T = Flv_producttree(xa, s, p, vs);
    2515       17785 :   long m = lg(T)-1;
    2516       17785 :   GEN P = Flx_deriv(gmael(T, m, 1), p);
    2517       17784 :   GEN R = Flv_inv(Flx_Flv_multieval_tree(P, xa, T, p), p);
    2518       17785 :   return gerepileuptoleaf(av, FlvV_polint_tree(T, R, s, xa, ya, p, vs));
    2519             : }
    2520             : 
    2521             : GEN
    2522       38887 : Flv_Flm_polint(GEN xa, GEN ya, ulong p, long vs)
    2523             : {
    2524       38887 :   pari_sp av = avma;
    2525       38887 :   GEN s = producttree_scheme(lg(xa)-1);
    2526       38886 :   GEN T = Flv_producttree(xa, s, p, vs);
    2527       38877 :   long i, m = lg(T)-1, l = lg(ya)-1;
    2528       38877 :   GEN P = Flx_deriv(gmael(T, m, 1), p);
    2529       38877 :   GEN R = Flv_inv(Flx_Flv_multieval_tree(P, xa, T, p), p);
    2530       38882 :   GEN M = cgetg(l+1, t_VEC);
    2531      779200 :   for (i=1; i<=l; i++)
    2532      740334 :     gel(M,i) = FlvV_polint_tree(T, R, s, xa, gel(ya,i), p, vs);
    2533       38866 :   return gerepileupto(av, M);
    2534             : }
    2535             : 
    2536             : GEN
    2537        4726 : Flv_invVandermonde(GEN L, ulong den, ulong p)
    2538             : {
    2539        4726 :   pari_sp av = avma;
    2540        4726 :   long i, n = lg(L);
    2541             :   GEN M, R;
    2542        4726 :   GEN s = producttree_scheme(n-1);
    2543        4726 :   GEN tree = Flv_producttree(L, s, p, 0);
    2544        4726 :   long m = lg(tree)-1;
    2545        4726 :   GEN T = gmael(tree, m, 1);
    2546        4726 :   R = Flv_inv(Flx_Flv_multieval_tree(Flx_deriv(T, p), L, tree, p), p);
    2547        4726 :   if (den!=1) R = Flv_Fl_mul(R, den, p);
    2548        4726 :   M = cgetg(n, t_MAT);
    2549       19874 :   for (i = 1; i < n; i++)
    2550             :   {
    2551       15148 :     GEN P = Flx_Fl_mul(Flx_div_by_X_x(T, uel(L,i), p, NULL), uel(R,i), p);
    2552       15148 :     gel(M,i) = Flx_to_Flv(P, n-1);
    2553             :   }
    2554        4726 :   return gerepilecopy(av, M);
    2555             : }
    2556             : 
    2557             : /***********************************************************************/
    2558             : /**                                                                   **/
    2559             : /**                               Flxq                                **/
    2560             : /**                                                                   **/
    2561             : /***********************************************************************/
    2562             : /* Flxq objects are defined as follows:
    2563             :    They are Flx modulo another Flx called q.
    2564             : */
    2565             : 
    2566             : /* Product of y and x in Z/pZ[X]/(T), as t_VECSMALL. */
    2567             : GEN
    2568   138124230 : Flxq_mul(GEN x,GEN y,GEN T,ulong p)
    2569             : {
    2570   138124230 :   return Flx_rem(Flx_mul(x,y,p),T,p);
    2571             : }
    2572             : 
    2573             : /* Square of y in Z/pZ[X]/(T), as t_VECSMALL. */
    2574             : GEN
    2575   198003991 : Flxq_sqr(GEN x,GEN T,ulong p)
    2576             : {
    2577   198003991 :   return Flx_rem(Flx_sqr(x,p),T,p);
    2578             : }
    2579             : 
    2580             : static GEN
    2581     1659540 : _Flxq_red(void *E, GEN x)
    2582     1659540 : { struct _Flxq *s = (struct _Flxq *)E;
    2583     1659540 :   return Flx_rem(x, s->T, s->p); }
    2584             : #if 0
    2585             : static GEN
    2586             : _Flx_sub(void *E, GEN x, GEN y)
    2587             : { struct _Flxq *s = (struct _Flxq *)E;
    2588             :   return Flx_sub(x,y,s->p); }
    2589             : #endif
    2590             : static GEN
    2591   192187004 : _Flxq_sqr(void *data, GEN x)
    2592             : {
    2593   192187004 :   struct _Flxq *D = (struct _Flxq*)data;
    2594   192187004 :   return Flxq_sqr(x, D->T, D->p);
    2595             : }
    2596             : static GEN
    2597   108570686 : _Flxq_mul(void *data, GEN x, GEN y)
    2598             : {
    2599   108570686 :   struct _Flxq *D = (struct _Flxq*)data;
    2600   108570686 :   return Flxq_mul(x,y, D->T, D->p);
    2601             : }
    2602             : static GEN
    2603     6178696 : _Flxq_one(void *data)
    2604             : {
    2605     6178696 :   struct _Flxq *D = (struct _Flxq*)data;
    2606     6178696 :   return pol1_Flx(get_Flx_var(D->T));
    2607             : }
    2608             : #if 0
    2609             : static GEN
    2610             : _Flxq_zero(void *data)
    2611             : {
    2612             :   struct _Flxq *D = (struct _Flxq*)data;
    2613             :   return pol0_Flx(get_Flx_var(D->T));
    2614             : }
    2615             : static GEN
    2616             : _Flxq_cmul(void *data, GEN P, long a, GEN x)
    2617             : {
    2618             :   struct _Flxq *D = (struct _Flxq*)data;
    2619             :   return Flx_Fl_mul(x, P[a+2], D->p);
    2620             : }
    2621             : #endif
    2622             : 
    2623             : /* n-Power of x in Z/pZ[X]/(T), as t_VECSMALL. */
    2624             : GEN
    2625    12480482 : Flxq_powu(GEN x, ulong n, GEN T, ulong p)
    2626             : {
    2627    12480482 :   pari_sp av = avma;
    2628             :   struct _Flxq D;
    2629             :   GEN y;
    2630    12480482 :   switch(n)
    2631             :   {
    2632           0 :     case 0: return pol1_Flx(get_Flx_var(T));
    2633       65629 :     case 1: return Flx_copy(x);
    2634      194892 :     case 2: return Flxq_sqr(x, T, p);
    2635             :   }
    2636    12219961 :   D.T = Flx_get_red(T, p); D.p = p;
    2637    12219223 :   y = gen_powu_i(x, n, (void*)&D, &_Flxq_sqr, &_Flxq_mul);
    2638    12200338 :   return gerepileuptoleaf(av, y);
    2639             : }
    2640             : 
    2641             : /* n-Power of x in Z/pZ[X]/(T), as t_VECSMALL. */
    2642             : GEN
    2643    22741955 : Flxq_pow(GEN x, GEN n, GEN T, ulong p)
    2644             : {
    2645    22741955 :   pari_sp av = avma;
    2646             :   struct _Flxq D;
    2647             :   GEN y;
    2648    22741955 :   long s = signe(n);
    2649    22741955 :   if (!s) return pol1_Flx(get_Flx_var(T));
    2650    22566072 :   if (s < 0)
    2651      567955 :     x = Flxq_inv(x,T,p);
    2652    22566072 :   if (is_pm1(n)) return s < 0 ? x : Flx_copy(x);
    2653    21861467 :   D.T = Flx_get_red(T, p); D.p = p;
    2654    21861455 :   y = gen_pow_i(x, n, (void*)&D, &_Flxq_sqr, &_Flxq_mul);
    2655    21861400 :   return gerepileuptoleaf(av, y);
    2656             : }
    2657             : 
    2658             : GEN
    2659          28 : Flxq_pow_init(GEN x, GEN n, long k,  GEN T, ulong p)
    2660             : {
    2661             :   struct _Flxq D;
    2662          28 :   D.T = Flx_get_red(T, p); D.p = p;
    2663          28 :   return gen_pow_init(x, n, k, (void*)&D, &_Flxq_sqr, &_Flxq_mul);
    2664             : }
    2665             : 
    2666             : GEN
    2667        4397 : Flxq_pow_table(GEN R, GEN n, GEN T, ulong p)
    2668             : {
    2669             :   struct _Flxq D;
    2670        4397 :   D.T = Flx_get_red(T, p); D.p = p;
    2671        4397 :   return gen_pow_table(R, n, (void*)&D, &_Flxq_one, &_Flxq_mul);
    2672             : }
    2673             : 
    2674             : /* Inverse of x in Z/lZ[X]/(T) or NULL if inverse doesn't exist
    2675             :  * not stack clean.
    2676             :  */
    2677             : GEN
    2678     4077976 : Flxq_invsafe(GEN x, GEN T, ulong p)
    2679             : {
    2680     4077976 :   GEN V, z = Flx_extgcd(get_Flx_mod(T), x, p, NULL, &V);
    2681             :   ulong iz;
    2682     4078132 :   if (degpol(z)) return NULL;
    2683     4077448 :   iz = Fl_inv (uel(z,2), p);
    2684     4077426 :   return Flx_Fl_mul(V, iz, p);
    2685             : }
    2686             : 
    2687             : GEN
    2688     3839596 : Flxq_inv(GEN x,GEN T,ulong p)
    2689             : {
    2690     3839596 :   pari_sp av=avma;
    2691     3839596 :   GEN U = Flxq_invsafe(x, T, p);
    2692     3839597 :   if (!U) pari_err_INV("Flxq_inv",Flx_to_ZX(x));
    2693     3839569 :   return gerepileuptoleaf(av, U);
    2694             : }
    2695             : 
    2696             : GEN
    2697     1904075 : Flxq_div(GEN x,GEN y,GEN T,ulong p)
    2698             : {
    2699     1904075 :   pari_sp av = avma;
    2700     1904075 :   return gerepileuptoleaf(av, Flxq_mul(x,Flxq_inv(y,T,p),T,p));
    2701             : }
    2702             : 
    2703             : GEN
    2704     6174410 : Flxq_powers(GEN x, long l, GEN T, ulong p)
    2705             : {
    2706             :   struct _Flxq D;
    2707     6174410 :   int use_sqr = 2*degpol(x) >= get_Flx_degree(T);
    2708     6174304 :   D.T = Flx_get_red(T, p); D.p = p;
    2709     6174219 :   return gen_powers(x, l, use_sqr, (void*)&D, &_Flxq_sqr, &_Flxq_mul, &_Flxq_one);
    2710             : }
    2711             : 
    2712             : GEN
    2713       38437 : Flxq_matrix_pow(GEN y, long n, long m, GEN P, ulong l)
    2714             : {
    2715       38437 :   return FlxV_to_Flm(Flxq_powers(y,m-1,P,l),n);
    2716             : }
    2717             : 
    2718             : GEN
    2719     4601858 : Flx_Frobenius(GEN T, ulong p)
    2720             : {
    2721     4601858 :   return Flxq_powu(polx_Flx(get_Flx_var(T)), p, T, p);
    2722             : }
    2723             : 
    2724             : GEN
    2725       19908 : Flx_matFrobenius(GEN T, ulong p)
    2726             : {
    2727       19908 :   long n = get_Flx_degree(T);
    2728       19908 :   return Flxq_matrix_pow(Flx_Frobenius(T, p), n, n, T, p);
    2729             : }
    2730             : 
    2731             : static GEN
    2732     5982074 : Flx_blocks_Flm(GEN P, long n, long m)
    2733             : {
    2734     5982074 :   GEN z = cgetg(m+1,t_MAT);
    2735     5981809 :   long i,j, k=2, l = lg(P);
    2736    18337404 :   for(i=1; i<=m; i++)
    2737             :   {
    2738    12357407 :     GEN zi = cgetg(n+1,t_VECSMALL);
    2739    12355595 :     gel(z,i) = zi;
    2740    59351957 :     for(j=1; j<=n; j++)
    2741    46996362 :       uel(zi, j) = k==l ? 0 : uel(P,k++);
    2742             :   }
    2743     5979997 :   return z;
    2744             : }
    2745             : 
    2746             : GEN
    2747       21663 : Flx_blocks(GEN P, long n, long m)
    2748             : {
    2749       21663 :   GEN z = cgetg(m+1,t_VEC);
    2750       21663 :   long i,j, k=2, l = lg(P);
    2751       64977 :   for(i=1; i<=m; i++)
    2752             :   {
    2753       43321 :     GEN zi = cgetg(n+2,t_VECSMALL);
    2754       43318 :     zi[1] = P[1];
    2755       43318 :     gel(z,i) = zi;
    2756      380957 :     for(j=2; j<n+2; j++)
    2757      337639 :       uel(zi, j) = k==l ? 0 : uel(P,k++);
    2758       43318 :     zi = Flx_renormalize(zi, n+2);
    2759             :   }
    2760       21656 :   return z;
    2761             : }
    2762             : 
    2763             : static GEN
    2764     5982150 : FlxV_to_Flm_lg(GEN x, long m, long n)
    2765             : {
    2766             :   long i;
    2767     5982150 :   GEN y = cgetg(n+1, t_MAT);
    2768    29764861 :   for (i=1; i<=n; i++) gel(y,i) = Flx_to_Flv(gel(x,i), m);
    2769     5981468 :   return y;
    2770             : }
    2771             : 
    2772             : GEN
    2773     6187398 : Flx_FlxqV_eval(GEN Q, GEN x, GEN T, ulong p)
    2774             : {
    2775     6187398 :   pari_sp btop, av = avma;
    2776     6187398 :   long sv = get_Flx_var(T), m = get_Flx_degree(T);
    2777     6187445 :   long i, l = lg(x)-1, lQ = lgpol(Q), n,  d;
    2778             :   GEN A, B, C, S, g;
    2779     6187776 :   if (lQ == 0) return pol0_Flx(sv);
    2780     5982449 :   if (lQ <= l)
    2781             :   {
    2782     2729029 :     n = l;
    2783     2729029 :     d = 1;
    2784             :   }
    2785             :   else
    2786             :   {
    2787     3253420 :     n = l-1;
    2788     3253420 :     d = (lQ+n-1)/n;
    2789             :   }
    2790     5982449 :   A = FlxV_to_Flm_lg(x, m, n);
    2791     5981965 :   B = Flx_blocks_Flm(Q, n, d);
    2792     5981346 :   C = gerepileupto(av, Flm_mul(A, B, p));
    2793     5982790 :   g = gel(x, l);
    2794     5982790 :   T = Flx_get_red(T, p);
    2795     5982615 :   btop = avma;
    2796     5982615 :   S = Flv_to_Flx(gel(C, d), sv);
    2797    12359994 :   for (i = d-1; i>0; i--)
    2798             :   {
    2799     6378215 :     S = Flx_add(Flxq_mul(S, g, T, p), Flv_to_Flx(gel(C,i), sv), p);
    2800     6377207 :     if (gc_needed(btop,1))
    2801           0 :       S = gerepileuptoleaf(btop, S);
    2802             :   }
    2803     5981779 :   return gerepileuptoleaf(av, S);
    2804             : }
    2805             : 
    2806             : GEN
    2807     1248572 : Flx_Flxq_eval(GEN Q, GEN x, GEN T, ulong p)
    2808             : {
    2809     1248572 :   pari_sp av = avma;
    2810             :   GEN z, V;
    2811     1248572 :   long d = degpol(Q), rtd;
    2812     1248561 :   if (d < 0) return pol0_Flx(get_Flx_var(T));
    2813     1248470 :   rtd = (long) sqrt((double)d);
    2814     1248470 :   T = Flx_get_red(T, p);
    2815     1248475 :   V = Flxq_powers(x, rtd, T, p);
    2816     1248477 :   z = Flx_FlxqV_eval(Q, V, T, p);
    2817     1248485 :   return gerepileupto(av, z);
    2818             : }
    2819             : 
    2820             : GEN
    2821           0 : FlxC_FlxqV_eval(GEN x, GEN v, GEN T, ulong p)
    2822           0 : { pari_APPLY_type(t_COL, Flx_FlxqV_eval(gel(x,i), v, T, p))
    2823             : }
    2824             : 
    2825             : GEN
    2826           0 : FlxC_Flxq_eval(GEN x, GEN F, GEN T, ulong p)
    2827             : {
    2828           0 :   long d = brent_kung_optpow(degpol(T)-1,lg(x)-1,1);
    2829           0 :   GEN Fp = Flxq_powers(F, d, T, p);
    2830           0 :   return FlxC_FlxqV_eval(x, Fp, T, p);
    2831             : }
    2832             : 
    2833             : #if 0
    2834             : static struct bb_algebra Flxq_algebra = { _Flxq_red, _Flx_add, _Flx_sub,
    2835             :               _Flxq_mul, _Flxq_sqr, _Flxq_one, _Flxq_zero};
    2836             : #endif
    2837             : 
    2838             : static GEN
    2839      368256 : Flxq_autpow_sqr(void *E, GEN x)
    2840             : {
    2841      368256 :   struct _Flxq *D = (struct _Flxq*)E;
    2842      368256 :   return Flx_Flxq_eval(x, x, D->T, D->p);
    2843             : }
    2844             : static GEN
    2845       20197 : Flxq_autpow_msqr(void *E, GEN x)
    2846             : {
    2847       20197 :   struct _Flxq *D = (struct _Flxq*)E;
    2848       20197 :   return Flx_FlxqV_eval(Flxq_autpow_sqr(E, x), D->aut, D->T, D->p);
    2849             : }
    2850             : 
    2851             : GEN
    2852      295261 : Flxq_autpow(GEN x, ulong n, GEN T, ulong p)
    2853             : {
    2854      295261 :   pari_sp av = avma;
    2855             :   struct _Flxq D;
    2856             :   long d;
    2857      295261 :   if (n==0) return Flx_rem(polx_Flx(x[1]), T, p);
    2858      295254 :   if (n==1) return Flx_rem(x, T, p);
    2859      294757 :   D.T = Flx_get_red(T, p); D.p = p;
    2860      294757 :   d = brent_kung_optpow(get_Flx_degree(T), hammingl(n)-1, 1);
    2861      294757 :   D.aut = Flxq_powers(x, d, T, p);
    2862      294757 :   x = gen_powu_fold_i(x,n,(void*)&D,Flxq_autpow_sqr,Flxq_autpow_msqr);
    2863      294757 :   return gerepilecopy(av, x);
    2864             : }
    2865             : 
    2866             : GEN
    2867        1659 : Flxq_autpowers(GEN x, ulong l, GEN T, ulong p)
    2868             : {
    2869        1659 :   long d, vT = get_Flx_var(T), dT = get_Flx_degree(T);
    2870             :   ulong i;
    2871        1659 :   pari_sp av = avma;
    2872        1659 :   GEN xp, V = cgetg(l+2,t_VEC);
    2873        1659 :   gel(V,1) = polx_Flx(vT); if (l==0) return V;
    2874        1659 :   gel(V,2) = gcopy(x); if (l==1) return V;
    2875        1659 :   T = Flx_get_red(T, p);
    2876        1659 :   d = brent_kung_optpow(dT-1, l-1, 1);
    2877        1659 :   xp = Flxq_powers(x, d, T, p);
    2878        6958 :   for(i = 3; i < l+2; i++)
    2879        5299 :     gel(V,i) = Flx_FlxqV_eval(gel(V,i-1), xp, T, p);
    2880        1659 :   return gerepilecopy(av, V);
    2881             : }
    2882             : 
    2883             : static GEN
    2884      477580 : Flxq_autsum_mul(void *E, GEN x, GEN y)
    2885             : {
    2886      477580 :   struct _Flxq *D = (struct _Flxq*)E;
    2887      477580 :   GEN T = D->T;
    2888      477580 :   ulong p = D->p;
    2889      477580 :   GEN phi1 = gel(x,1), a1 = gel(x,2);
    2890      477580 :   GEN phi2 = gel(y,1), a2 = gel(y,2);
    2891      477580 :   ulong d = brent_kung_optpow(maxss(degpol(phi1),degpol(a1)),2,1);
    2892      477580 :   GEN V2 = Flxq_powers(phi2, d, T, p);
    2893      477580 :   GEN phi3 = Flx_FlxqV_eval(phi1, V2, T, p);
    2894      477580 :   GEN aphi = Flx_FlxqV_eval(a1, V2, T, p);
    2895      477580 :   GEN a3 = Flxq_mul(aphi, a2, T, p);
    2896      477580 :   return mkvec2(phi3, a3);
    2897             : }
    2898             : static GEN
    2899      279564 : Flxq_autsum_sqr(void *E, GEN x)
    2900      279564 : { return Flxq_autsum_mul(E, x, x); }
    2901             : 
    2902             : GEN
    2903      223177 : Flxq_autsum(GEN x, ulong n, GEN T, ulong p)
    2904             : {
    2905      223177 :   pari_sp av = avma;
    2906             :   struct _Flxq D;
    2907      223177 :   D.T = Flx_get_red(T, p); D.p = p;
    2908      223177 :   x = gen_powu_i(x,n,(void*)&D,Flxq_autsum_sqr,Flxq_autsum_mul);
    2909      223177 :   return gerepilecopy(av, x);
    2910             : }
    2911             : 
    2912             : static GEN
    2913      364109 : Flxq_auttrace_mul(void *E, GEN x, GEN y)
    2914             : {
    2915      364109 :   struct _Flxq *D = (struct _Flxq*)E;
    2916      364109 :   GEN T = D->T;
    2917      364109 :   ulong p = D->p;
    2918      364109 :   GEN phi1 = gel(x,1), a1 = gel(x,2);
    2919      364109 :   GEN phi2 = gel(y,1), a2 = gel(y,2);
    2920      364109 :   ulong d = brent_kung_optpow(maxss(degpol(phi1),degpol(a1)),2,1);
    2921      364125 :   GEN V1 = Flxq_powers(phi1, d, T, p);
    2922      364078 :   GEN phi3 = Flx_FlxqV_eval(phi2, V1, T, p);
    2923      364070 :   GEN aphi = Flx_FlxqV_eval(a2, V1, T, p);
    2924      364085 :   GEN a3 = Flx_add(a1, aphi, p);
    2925      364092 :   return mkvec2(phi3, a3);
    2926             : }
    2927             : 
    2928             : static GEN
    2929      291912 : Flxq_auttrace_sqr(void *E, GEN x)
    2930      291912 : { return Flxq_auttrace_mul(E, x, x); }
    2931             : 
    2932             : GEN
    2933      358340 : Flxq_auttrace(GEN x, ulong n, GEN T, ulong p)
    2934             : {
    2935      358340 :   pari_sp av = avma;
    2936             :   struct _Flxq D;
    2937      358340 :   D.T = Flx_get_red(T, p); D.p = p;
    2938      358337 :   x = gen_powu_i(x,n,(void*)&D,Flxq_auttrace_sqr,Flxq_auttrace_mul);
    2939      358326 :   return gerepilecopy(av, x);
    2940             : }
    2941             : 
    2942             : static long
    2943      497294 : bounded_order(ulong p, GEN b, long k)
    2944             : {
    2945             :   long i;
    2946      497294 :   GEN a=modii(utoi(p),b);
    2947     1375525 :   for(i=1;i<k;i++)
    2948             :   {
    2949     1168683 :     if (equali1(a))
    2950      290452 :       return i;
    2951      878231 :     a = modii(muliu(a,p),b);
    2952             :   }
    2953      206842 :   return 0;
    2954             : }
    2955             : 
    2956             : /*
    2957             :   n = (p^d-a)\b
    2958             :   b = bb*p^vb
    2959             :   p^k = 1 [bb]
    2960             :   d = m*k+r+vb
    2961             :   u = (p^k-1)/bb;
    2962             :   v = (p^(r+vb)-a)/b;
    2963             :   w = (p^(m*k)-1)/(p^k-1)
    2964             :   n = p^r*w*u+v
    2965             :   w*u = p^vb*(p^(m*k)-1)/b
    2966             :   n = p^(r+vb)*(p^(m*k)-1)/b+(p^(r+vb)-a)/b
    2967             : */
    2968             : 
    2969             : static GEN
    2970    22322043 : Flxq_pow_Frobenius(GEN x, GEN n, GEN aut, GEN T, ulong p)
    2971             : {
    2972    22322043 :   pari_sp av=avma;
    2973    22322043 :   long d = get_Flx_degree(T);
    2974    22322043 :   GEN an = absi_shallow(n), z, q;
    2975    22322043 :   if (abscmpiu(an,p)<0 || cmpis(an,d)<=0) return Flxq_pow(x, n, T, p);
    2976      497449 :   q = powuu(p, d);
    2977      497449 :   if (dvdii(q, n))
    2978             :   {
    2979         134 :     long vn = logint(an,utoi(p));
    2980         134 :     GEN autvn = vn==1 ? aut: Flxq_autpow(aut,vn,T,p);
    2981         134 :     z = Flx_Flxq_eval(x,autvn,T,p);
    2982             :   } else
    2983             :   {
    2984      497315 :     GEN b = diviiround(q, an), a = subii(q, mulii(an,b));
    2985             :     GEN bb, u, v, autk;
    2986      497315 :     long vb = Z_lvalrem(b,p,&bb);
    2987      497315 :     long m, r, k = is_pm1(bb) ? 1 : bounded_order(p,bb,d);
    2988      497315 :     if (!k || d-vb<k) return Flxq_pow(x,n, T, p);
    2989      290466 :     m = (d-vb)/k; r = (d-vb)%k;
    2990      290466 :     u = diviiexact(subiu(powuu(p,k),1),bb);
    2991      290466 :     v = diviiexact(subii(powuu(p,r+vb),a),b);
    2992      290466 :     autk = k==1 ? aut: Flxq_autpow(aut,k,T,p);
    2993      290466 :     if (r)
    2994             :     {
    2995       93004 :       GEN autr = r==1 ? aut: Flxq_autpow(aut,r,T,p);
    2996       93004 :       z = Flx_Flxq_eval(x,autr,T,p);
    2997      197462 :     } else z = x;
    2998      290466 :     if (m > 1) z = gel(Flxq_autsum(mkvec2(autk, z), m, T, p), 2);
    2999      290466 :     if (!is_pm1(u)) z = Flxq_pow(z, u, T, p);
    3000      290466 :     if (signe(v)) z = Flxq_mul(z, Flxq_pow(x, v, T, p), T, p);
    3001             :   }
    3002      290600 :   return gerepileupto(av,signe(n)>0 ? z : Flxq_inv(z,T,p));
    3003             : }
    3004             : 
    3005             : static GEN
    3006    22317001 : _Flxq_pow(void *data, GEN x, GEN n)
    3007             : {
    3008    22317001 :   struct _Flxq *D = (struct _Flxq*)data;
    3009    22317001 :   return Flxq_pow_Frobenius(x, n, D->aut, D->T, D->p);
    3010             : }
    3011             : 
    3012             : static GEN
    3013      320460 : _Flxq_rand(void *data)
    3014             : {
    3015      320460 :   pari_sp av=avma;
    3016      320460 :   struct _Flxq *D = (struct _Flxq*)data;
    3017             :   GEN z;
    3018             :   do
    3019             :   {
    3020      323536 :     set_avma(av);
    3021      323536 :     z = random_Flx(get_Flx_degree(D->T),get_Flx_var(D->T),D->p);
    3022      323536 :   } while (lgpol(z)==0);
    3023      320460 :   return z;
    3024             : }
    3025             : 
    3026             : /* discrete log in FpXQ for a in Fp^*, g in FpXQ^* of order ord */
    3027             : static GEN
    3028       14282 : Fl_Flxq_log(ulong a, GEN g, GEN o, GEN T, ulong p)
    3029             : {
    3030       14282 :   pari_sp av = avma;
    3031             :   GEN q,n_q,ord,ordp, op;
    3032             : 
    3033       14282 :   if (a == 1UL) return gen_0;
    3034             :   /* p > 2 */
    3035             : 
    3036       14282 :   ordp = utoi(p - 1);
    3037       14282 :   ord  = get_arith_Z(o);
    3038       14282 :   if (!ord) ord = T? subiu(powuu(p, get_FpX_degree(T)), 1): ordp;
    3039       14282 :   if (a == p - 1) /* -1 */
    3040        1551 :     return gerepileuptoint(av, shifti(ord,-1));
    3041       12731 :   ordp = gcdii(ordp, ord);
    3042       12731 :   op = typ(o)==t_MAT ? famat_Z_gcd(o, ordp) : ordp;
    3043             : 
    3044       12731 :   q = NULL;
    3045       12731 :   if (T)
    3046             :   { /* we want < g > = Fp^* */
    3047       12731 :     if (!equalii(ord,ordp)) {
    3048        4455 :       q = diviiexact(ord,ordp);
    3049        4455 :       g = Flxq_pow(g,q,T,p);
    3050             :     }
    3051             :   }
    3052       12731 :   n_q = Fp_log(utoi(a), utoi(uel(g,2)), op, utoi(p));
    3053       12731 :   if (lg(n_q)==1) return gerepileuptoleaf(av, n_q);
    3054       12731 :   if (q) n_q = mulii(q, n_q);
    3055       12731 :   return gerepileuptoint(av, n_q);
    3056             : }
    3057             : 
    3058             : static GEN
    3059      245743 : Flxq_easylog(void* E, GEN a, GEN g, GEN ord)
    3060             : {
    3061      245743 :   struct _Flxq *f = (struct _Flxq *)E;
    3062      245743 :   GEN T = f->T;
    3063      245743 :   ulong p = f->p;
    3064      245743 :   long d = get_Flx_degree(T);
    3065      245743 :   if (Flx_equal1(a)) return gen_0;
    3066      223953 :   if (Flx_equal(a,g)) return gen_1;
    3067       36329 :   if (!degpol(a))
    3068       14282 :     return Fl_Flxq_log(uel(a,2), g, ord, T, p);
    3069       22047 :   if (typ(ord)!=t_INT || d <= 4 || d == 6 || abscmpiu(ord,1UL<<27)<0)
    3070       22019 :     return NULL;
    3071          28 :   return Flxq_log_index(a, g, ord, T, p);
    3072             : }
    3073             : 
    3074             : static const struct bb_group Flxq_star={_Flxq_mul,_Flxq_pow,_Flxq_rand,hash_GEN,Flx_equal,Flx_equal1,Flxq_easylog};
    3075             : 
    3076             : const struct bb_group *
    3077      210988 : get_Flxq_star(void **E, GEN T, ulong p)
    3078             : {
    3079      210988 :   struct _Flxq *e = (struct _Flxq *) stack_malloc(sizeof(struct _Flxq));
    3080      210988 :   e->T = T; e->p  = p; e->aut =  Flx_Frobenius(T, p);
    3081      210988 :   *E = (void*)e; return &Flxq_star;
    3082             : }
    3083             : 
    3084             : GEN
    3085       12788 : Flxq_order(GEN a, GEN ord, GEN T, ulong p)
    3086             : {
    3087             :   void *E;
    3088       12788 :   const struct bb_group *S = get_Flxq_star(&E,T,p);
    3089       12788 :   return gen_order(a,ord,E,S);
    3090             : }
    3091             : 
    3092             : GEN
    3093       30300 : Flxq_log(GEN a, GEN g, GEN ord, GEN T, ulong p)
    3094             : {
    3095             :   void *E;
    3096       30300 :   pari_sp av = avma;
    3097       30300 :   const struct bb_group *S = get_Flxq_star(&E,T,p);
    3098       30300 :   GEN v = get_arith_ZZM(ord), F = gmael(v,2,1);
    3099       30300 :   if (Flxq_log_use_index(gel(F,lg(F)-1), T, p))
    3100        5635 :     v = mkvec2(gel(v, 1), ZM_famat_limit(gel(v, 2), int2n(27)));
    3101       30300 :   return gerepileuptoleaf(av, gen_PH_log(a, g, v, E, S));
    3102             : }
    3103             : 
    3104             : GEN
    3105      171022 : Flxq_sqrtn(GEN a, GEN n, GEN T, ulong p, GEN *zeta)
    3106             : {
    3107      171022 :   if (!lgpol(a))
    3108             :   {
    3109        3122 :     if (signe(n) < 0) pari_err_INV("Flxq_sqrtn",a);
    3110        3115 :     if (zeta)
    3111           0 :       *zeta=pol1_Flx(get_Flx_var(T));
    3112        3115 :     return pol0_Flx(get_Flx_var(T));
    3113             :   }
    3114             :   else
    3115             :   {
    3116             :     void *E;
    3117      167900 :     pari_sp av = avma;
    3118      167900 :     const struct bb_group *S = get_Flxq_star(&E,T,p);
    3119      167900 :     GEN o = subiu(powuu(p,get_Flx_degree(T)), 1);
    3120      167900 :     GEN s = gen_Shanks_sqrtn(a,n,o,zeta,E,S);
    3121      167900 :     if (s) gerepileall(av, zeta?2:1, &s, zeta);
    3122      167900 :     return s;
    3123             :   }
    3124             : }
    3125             : 
    3126             : GEN
    3127      162101 : Flxq_sqrt(GEN a, GEN T, ulong p)
    3128             : {
    3129      162101 :   return Flxq_sqrtn(a, gen_2, T, p, NULL);
    3130             : }
    3131             : 
    3132             : /* assume T irreducible mod p */
    3133             : int
    3134      358932 : Flxq_issquare(GEN x, GEN T, ulong p)
    3135             : {
    3136      358932 :   if (lgpol(x) == 0 || p == 2) return 1;
    3137      355761 :   return krouu(Flxq_norm(x,T,p), p) == 1;
    3138             : }
    3139             : 
    3140             : /* assume T irreducible mod p */
    3141             : int
    3142         280 : Flxq_is2npower(GEN x, long n, GEN T, ulong p)
    3143             : {
    3144             :   pari_sp av;
    3145             :   GEN m;
    3146         280 :   if (n==1) return Flxq_issquare(x, T, p);
    3147         280 :   if (lgpol(x) == 0 || p == 2) return 1;
    3148         280 :   av = avma;
    3149         280 :   m = shifti(subiu(powuu(p, get_Flx_degree(T)), 1), -n);
    3150         280 :   return gc_bool(av, Flx_equal1(Flxq_pow(x, m, T, p)));
    3151             : }
    3152             : 
    3153             : GEN
    3154      113505 : Flxq_lroot_fast(GEN a, GEN sqx, GEN T, long p)
    3155             : {
    3156      113505 :   pari_sp av=avma;
    3157      113505 :   GEN A = Flx_splitting(a,p);
    3158      113505 :   return gerepileuptoleaf(av, FlxqV_dotproduct(A,sqx,T,p));
    3159             : }
    3160             : 
    3161             : GEN
    3162       25032 : Flxq_lroot(GEN a, GEN T, long p)
    3163             : {
    3164       25032 :   pari_sp av=avma;
    3165       25032 :   long n = get_Flx_degree(T), d = degpol(a);
    3166             :   GEN sqx, V;
    3167       25032 :   if (n==1) return leafcopy(a);
    3168       25032 :   if (n==2) return Flxq_powu(a, p, T, p);
    3169       25032 :   sqx = Flxq_autpow(Flx_Frobenius(T, p), n-1, T, p);
    3170       25032 :   if (d==1 && a[2]==0 && a[3]==1) return gerepileuptoleaf(av, sqx);
    3171           0 :   if (d>=p)
    3172             :   {
    3173           0 :     V = Flxq_powers(sqx,p-1,T,p);
    3174           0 :     return gerepileuptoleaf(av, Flxq_lroot_fast(a,V,T,p));
    3175             :   } else
    3176           0 :     return gerepileuptoleaf(av, Flx_Flxq_eval(a,sqx,T,p));
    3177             : }
    3178             : 
    3179             : ulong
    3180      386128 : Flxq_norm(GEN x, GEN TB, ulong p)
    3181             : {
    3182      386128 :   GEN T = get_Flx_mod(TB);
    3183      386128 :   ulong y = Flx_resultant(T, x, p);
    3184      386128 :   ulong L = Flx_lead(T);
    3185      386128 :   if ( L==1 || lgpol(x)==0) return y;
    3186           0 :   return Fl_div(y, Fl_powu(L, (ulong)degpol(x), p), p);
    3187             : }
    3188             : 
    3189             : ulong
    3190        3212 : Flxq_trace(GEN x, GEN TB, ulong p)
    3191             : {
    3192        3212 :   pari_sp av = avma;
    3193             :   ulong t;
    3194        3212 :   GEN T = get_Flx_mod(TB);
    3195        3212 :   long n = degpol(T)-1;
    3196        3212 :   GEN z = Flxq_mul(x, Flx_deriv(T, p), TB, p);
    3197        3212 :   t = degpol(z)<n ? 0 : Fl_div(z[2+n],T[3+n],p);
    3198        3212 :   return gc_ulong(av, t);
    3199             : }
    3200             : 
    3201             : /*x must be reduced*/
    3202             : GEN
    3203        3268 : Flxq_charpoly(GEN x, GEN TB, ulong p)
    3204             : {
    3205        3268 :   pari_sp ltop=avma;
    3206        3268 :   GEN T = get_Flx_mod(TB);
    3207        3268 :   long vs = evalvarn(fetch_var());
    3208        3268 :   GEN xm1 = deg1pol_shallow(pol1_Flx(x[1]),Flx_neg(x,p),vs);
    3209        3268 :   GEN r = Flx_FlxY_resultant(T, xm1, p);
    3210        3268 :   r[1] = x[1];
    3211        3268 :   (void)delete_var(); return gerepileupto(ltop, r);
    3212             : }
    3213             : 
    3214             : /* Computing minimal polynomial :                         */
    3215             : /* cf Shoup 'Efficient Computation of Minimal Polynomials */
    3216             : /*          in Algebraic Extensions of Finite Fields'     */
    3217             : 
    3218             : /* Let v a linear form, return the linear form z->v(tau*z)
    3219             :    that is, v*(M_tau) */
    3220             : 
    3221             : static GEN
    3222      620062 : Flxq_transmul_init(GEN tau, GEN T, ulong p)
    3223             : {
    3224             :   GEN bht;
    3225      620062 :   GEN h, Tp = get_Flx_red(T, &h);
    3226      620059 :   long n = degpol(Tp), vT = Tp[1];
    3227      620053 :   GEN ft = Flx_recipspec(Tp+2, n+1, n+1);
    3228      620055 :   GEN bt = Flx_recipspec(tau+2, lgpol(tau), n);
    3229      620045 :   ft[1] = vT; bt[1] = vT;
    3230      620045 :   if (h)
    3231        2964 :     bht = Flxn_mul(bt, h, n-1, p);
    3232             :   else
    3233             :   {
    3234      617081 :     GEN bh = Flx_div(Flx_shift(tau, n-1), T, p);
    3235      617067 :     bht = Flx_recipspec(bh+2, lgpol(bh), n-1);
    3236      617069 :     bht[1] = vT;
    3237             :   }
    3238      620033 :   return mkvec3(bt, bht, ft);
    3239             : }
    3240             : 
    3241             : static GEN
    3242     1660264 : Flxq_transmul(GEN tau, GEN a, long n, ulong p)
    3243             : {
    3244     1660264 :   pari_sp ltop = avma;
    3245             :   GEN t1, t2, t3, vec;
    3246     1660264 :   GEN bt = gel(tau, 1), bht = gel(tau, 2), ft = gel(tau, 3);
    3247     1660264 :   if (lgpol(a)==0) return pol0_Flx(a[1]);
    3248     1649387 :   t2  = Flx_shift(Flx_mul(bt, a, p),1-n);
    3249     1649085 :   if (lgpol(bht)==0) return gerepileuptoleaf(ltop, t2);
    3250     1290753 :   t1  = Flx_shift(Flx_mul(ft, a, p),-n);
    3251     1290788 :   t3  = Flxn_mul(t1, bht, n-1, p);
    3252     1290807 :   vec = Flx_sub(t2, Flx_shift(t3, 1), p);
    3253     1290813 :   return gerepileuptoleaf(ltop, vec);
    3254             : }
    3255             : 
    3256             : GEN
    3257      291019 : Flxq_minpoly(GEN x, GEN T, ulong p)
    3258             : {
    3259      291019 :   pari_sp ltop = avma;
    3260      291019 :   long vT = get_Flx_var(T), n = get_Flx_degree(T);
    3261             :   GEN v_x;
    3262      291017 :   GEN g = pol1_Flx(vT), tau = pol1_Flx(vT);
    3263      290987 :   T = Flx_get_red(T, p);
    3264      290990 :   v_x = Flxq_powers(x, usqrt(2*n), T, p);
    3265      601010 :   while (lgpol(tau) != 0)
    3266             :   {
    3267             :     long i, j, m, k1;
    3268             :     GEN M, v, tr;
    3269             :     GEN g_prime, c;
    3270      310017 :     if (degpol(g) == n) { tau = pol1_Flx(vT); g = pol1_Flx(vT); }
    3271      310016 :     v = random_Flx(n, vT, p);
    3272      310041 :     tr = Flxq_transmul_init(tau, T, p);
    3273      310023 :     v = Flxq_transmul(tr, v, n, p);
    3274      310030 :     m = 2*(n-degpol(g));
    3275      310032 :     k1 = usqrt(m);
    3276      310034 :     tr = Flxq_transmul_init(gel(v_x,k1+1), T, p);
    3277      310025 :     c = cgetg(m+2,t_VECSMALL);
    3278      310046 :     c[1] = vT;
    3279     1660167 :     for (i=0; i<m; i+=k1)
    3280             :     {
    3281     1350136 :       long mj = minss(m-i, k1);
    3282     6239229 :       for (j=0; j<mj; j++)
    3283     4888824 :         uel(c,m+1-(i+j)) = Flx_dotproduct(v, gel(v_x,j+1), p);
    3284     1350405 :       v = Flxq_transmul(tr, v, n, p);
    3285             :     }
    3286      310031 :     c = Flx_renormalize(c, m+2);
    3287             :     /* now c contains <v,x^i> , i = 0..m-1  */
    3288      310030 :     M = Flx_halfgcd(monomial_Flx(1, m, vT), c, p);
    3289      310047 :     g_prime = gmael(M, 2, 2);
    3290      310047 :     if (degpol(g_prime) < 1) continue;
    3291      306171 :     g = Flx_mul(g, g_prime, p);
    3292      306145 :     tau = Flxq_mul(tau, Flx_FlxqV_eval(g_prime, v_x, T, p), T, p);
    3293             :   }
    3294      290967 :   g = Flx_normalize(g,p);
    3295      291005 :   return gerepileuptoleaf(ltop,g);
    3296             : }
    3297             : 
    3298             : GEN
    3299          20 : Flxq_conjvec(GEN x, GEN T, ulong p)
    3300             : {
    3301          20 :   long i, l = 1+get_Flx_degree(T);
    3302          20 :   GEN z = cgetg(l,t_COL);
    3303          20 :   T = Flx_get_red(T,p);
    3304          20 :   gel(z,1) = Flx_copy(x);
    3305          88 :   for (i=2; i<l; i++) gel(z,i) = Flxq_powu(gel(z,i-1), p, T, p);
    3306          20 :   return z;
    3307             : }
    3308             : 
    3309             : GEN
    3310        5542 : gener_Flxq(GEN T, ulong p, GEN *po)
    3311             : {
    3312        5542 :   long i, j, vT = get_Flx_var(T), f = get_Flx_degree(T);
    3313             :   ulong p_1;
    3314             :   GEN g, L, L2, o, q, F;
    3315             :   pari_sp av0, av;
    3316             : 
    3317        5542 :   if (f == 1) {
    3318             :     GEN fa;
    3319          28 :     o = utoipos(p-1);
    3320          28 :     fa = Z_factor(o);
    3321          28 :     L = gel(fa,1);
    3322          28 :     L = vecslice(L, 2, lg(L)-1); /* remove 2 for efficiency */
    3323          28 :     g = Fl_to_Flx(pgener_Fl_local(p, vec_to_vecsmall(L)), vT);
    3324          28 :     if (po) *po = mkvec2(o, fa);
    3325          28 :     return g;
    3326             :   }
    3327             : 
    3328        5514 :   av0 = avma; p_1 = p - 1;
    3329        5514 :   q = diviuexact(subiu(powuu(p,f), 1), p_1);
    3330             : 
    3331        5514 :   L = cgetg(1, t_VECSMALL);
    3332        5514 :   if (p > 3)
    3333             :   {
    3334        1342 :     ulong t = p_1 >> vals(p_1);
    3335        1342 :     GEN P = gel(factoru(t), 1);
    3336        1342 :     L = cgetg_copy(P, &i);
    3337        1967 :     while (--i) L[i] = p_1 / P[i];
    3338             :   }
    3339        5514 :   o = factor_pn_1(utoipos(p),f);
    3340        5514 :   L2 = leafcopy( gel(o, 1) );
    3341       13374 :   for (i = j = 1; i < lg(L2); i++)
    3342             :   {
    3343        7860 :     if (umodui(p_1, gel(L2,i)) == 0) continue;
    3344        4472 :     gel(L2,j++) = diviiexact(q, gel(L2,i));
    3345             :   }
    3346        5514 :   setlg(L2, j);
    3347        5514 :   F = Flx_Frobenius(T, p);
    3348       13508 :   for (av = avma;; set_avma(av))
    3349        7994 :   {
    3350             :     GEN tt;
    3351       13508 :     g = random_Flx(f, vT, p);
    3352       13508 :     if (degpol(g) < 1) continue;
    3353        8227 :     if (p == 2) tt = g;
    3354             :     else
    3355             :     {
    3356        5315 :       ulong t = Flxq_norm(g, T, p);
    3357        5315 :       if (t == 1 || !is_gener_Fl(t, p, p_1, L)) continue;
    3358        3096 :       tt = Flxq_powu(g, p_1>>1, T, p);
    3359             :     }
    3360       10556 :     for (i = 1; i < j; i++)
    3361             :     {
    3362        5042 :       GEN a = Flxq_pow_Frobenius(tt, gel(L2,i), F, T, p);
    3363        5042 :       if (!degpol(a) && uel(a,2) == p_1) break;
    3364             :     }
    3365        6008 :     if (i == j) break;
    3366             :   }
    3367        5514 :   if (!po)
    3368             :   {
    3369         180 :     set_avma((pari_sp)g);
    3370         180 :     g = gerepileuptoleaf(av0, g);
    3371             :   }
    3372             :   else {
    3373        5334 :     *po = mkvec2(subiu(powuu(p,f), 1), o);
    3374        5334 :     gerepileall(av0, 2, &g, po);
    3375             :   }
    3376        5514 :   return g;
    3377             : }
    3378             : 
    3379             : static GEN
    3380      483266 : _Flxq_neg(void *E, GEN x)
    3381      483266 : { struct _Flxq *s = (struct _Flxq *)E;
    3382      483266 :   return Flx_neg(x,s->p); }
    3383             : 
    3384             : static GEN
    3385     1484505 : _Flxq_rmul(void *E, GEN x, GEN y)
    3386     1484505 : { struct _Flxq *s = (struct _Flxq *)E;
    3387     1484505 :   return Flx_mul(x,y,s->p); }
    3388             : 
    3389             : static GEN
    3390       17199 : _Flxq_inv(void *E, GEN x)
    3391       17199 : { struct _Flxq *s = (struct _Flxq *)E;
    3392       17199 :   return Flxq_inv(x,s->T,s->p); }
    3393             : 
    3394             : static int
    3395      147511 : _Flxq_equal0(GEN x) { return lgpol(x)==0; }
    3396             : 
    3397             : static GEN
    3398       22841 : _Flxq_s(void *E, long x)
    3399       22841 : { struct _Flxq *s = (struct _Flxq *)E;
    3400       22841 :   ulong u = x<0 ? s->p+x: (ulong)x;
    3401       22841 :   return Fl_to_Flx(u, get_Flx_var(s->T));
    3402             : }
    3403             : 
    3404             : static const struct bb_field Flxq_field={_Flxq_red,_Flx_add,_Flxq_rmul,_Flxq_neg,
    3405             :                                          _Flxq_inv,_Flxq_equal0,_Flxq_s};
    3406             : 
    3407       66434 : const struct bb_field *get_Flxq_field(void **E, GEN T, ulong p)
    3408             : {
    3409       66434 :   GEN z = new_chunk(sizeof(struct _Flxq));
    3410       66434 :   struct _Flxq *e = (struct _Flxq *) z;
    3411       66434 :   e->T = Flx_get_red(T, p); e->p  = p; *E = (void*)e;
    3412       66434 :   return &Flxq_field;
    3413             : }
    3414             : 
    3415             : /***********************************************************************/
    3416             : /**                                                                   **/
    3417             : /**                               Flxn                                **/
    3418             : /**                                                                   **/
    3419             : /***********************************************************************/
    3420             : 
    3421             : GEN
    3422        3194 : Flx_invLaplace(GEN x, ulong p)
    3423             : {
    3424        3194 :   long i, d = degpol(x);
    3425             :   ulong t;
    3426             :   GEN y;
    3427        3194 :   if (d <= 1) return Flx_copy(x);
    3428        3194 :   t = Fl_inv(factorial_Fl(d, p), p);
    3429        3195 :   y = cgetg(d+3, t_VECSMALL);
    3430        3195 :   y[1] = x[1];
    3431      111202 :   for (i=d; i>=2; i--)
    3432             :   {
    3433      108007 :     uel(y,i+2) = Fl_mul(uel(x,i+2), t, p);
    3434      108005 :     t = Fl_mul(t, i, p);
    3435             :   }
    3436        3195 :   uel(y,3) = uel(x,3);
    3437        3195 :   uel(y,2) = uel(x,2);
    3438        3195 :   return y;
    3439             : }
    3440             : 
    3441             : GEN
    3442        1597 : Flx_Laplace(GEN x, ulong p)
    3443             : {
    3444        1597 :   long i, d = degpol(x);
    3445        1597 :   ulong t = 1;
    3446             :   GEN y;
    3447        1597 :   if (d <= 1) return Flx_copy(x);
    3448        1597 :   y = cgetg(d+3, t_VECSMALL);
    3449        1597 :   y[1] = x[1];
    3450        1597 :   uel(y,2) = uel(x,2);
    3451        1597 :   uel(y,3) = uel(x,3);
    3452       55556 :   for (i=2; i<=d; i++)
    3453             :   {
    3454       53959 :     t = Fl_mul(t, i%p, p);
    3455       53959 :     uel(y,i+2) = Fl_mul(uel(x,i+2), t, p);
    3456             :   }
    3457        1597 :   return y;
    3458             : }
    3459             : 
    3460             : GEN
    3461     1406884 : Flxn_red(GEN a, long n)
    3462             : {
    3463     1406884 :   long i, L, l = lg(a);
    3464             :   GEN  b;
    3465     1406884 :   if (l == 2 || !n) return zero_Flx(a[1]);
    3466     1387084 :   L = n+2; if (L > l) L = l;
    3467     1387084 :   b = cgetg(L, t_VECSMALL); b[1] = a[1];
    3468    15845248 :   for (i=2; i<L; i++) b[i] = a[i];
    3469     1386816 :   return Flx_renormalize(b,L);
    3470             : }
    3471             : 
    3472             : GEN
    3473     1373850 : Flxn_mul(GEN a, GEN b, long n, ulong p)
    3474     1373850 : { return Flxn_red(Flx_mul(a, b, p), n); }
    3475             : 
    3476             : GEN
    3477           0 : Flxn_sqr(GEN a, long n, ulong p)
    3478           0 : { return Flxn_red(Flx_sqr(a, p), n); }
    3479             : 
    3480             : /* (f*g) \/ x^n */
    3481             : static GEN
    3482       30626 : Flx_mulhigh_i(GEN f, GEN g, long n, ulong p)
    3483             : {
    3484       30626 :   return Flx_shift(Flx_mul(f,g, p),-n);
    3485             : }
    3486             : 
    3487             : static GEN
    3488       21663 : Flxn_mulhigh(GEN f, GEN g, long n2, long n, ulong p)
    3489             : {
    3490       21663 :   GEN F = Flx_blocks(f, n2, 2), fl = gel(F,1), fh = gel(F,2);
    3491       21660 :   return Flx_add(Flx_mulhigh_i(fl, g, n2, p), Flxn_mul(fh, g, n - n2, p), p);
    3492             : }
    3493             : 
    3494             : GEN
    3495        3384 : Flxn_inv(GEN f, long e, ulong p)
    3496             : {
    3497        3384 :   pari_sp av = avma, av2;
    3498             :   ulong mask;
    3499             :   GEN W;
    3500        3384 :   long n=1;
    3501        3384 :   if (lg(f)==2) pari_err_INV("Flxn_inv",f);
    3502        3384 :   W = Fl_to_Flx(Fl_inv(uel(f,2),p), f[1]);
    3503        3384 :   mask = quadratic_prec_mask(e);
    3504        3384 :   av2 = avma;
    3505       18096 :   for (;mask>1;)
    3506             :   {
    3507             :     GEN u, fr;
    3508       14712 :     long n2 = n;
    3509       14712 :     n<<=1; if (mask & 1) n--;
    3510       14712 :     mask >>= 1;
    3511       14712 :     fr = Flxn_red(f, n);
    3512       14712 :     u = Flxn_mul(W, Flxn_mulhigh(fr, W, n2, n, p), n-n2, p);
    3513       14710 :     W = Flx_sub(W, Flx_shift(u, n2), p);
    3514       14711 :     if (gc_needed(av2,2))
    3515             :     {
    3516           0 :       if(DEBUGMEM>1) pari_warn(warnmem,"Flxn_inv, e = %ld", n);
    3517           0 :       W = gerepileupto(av2, W);
    3518             :     }
    3519             :   }
    3520        3384 :   return gerepileupto(av, W);
    3521             : }
    3522             : 
    3523             : GEN
    3524        2029 : Flxn_expint(GEN h, long e, ulong p)
    3525             : {
    3526        2029 :   pari_sp av = avma, av2;
    3527        2029 :   long v = h[1], n=1;
    3528        2029 :   GEN f = pol1_Flx(v), g = pol1_Flx(v);
    3529        2029 :   ulong mask = quadratic_prec_mask(e);
    3530        2029 :   av2 = avma;
    3531        8979 :   for (;mask>1;)
    3532             :   {
    3533             :     GEN u, w;
    3534        8979 :     long n2 = n;
    3535        8979 :     n<<=1; if (mask & 1) n--;
    3536        8979 :     mask >>= 1;
    3537        8979 :     u = Flxn_mul(g, Flx_mulhigh_i(f, Flxn_red(h, n2-1), n2-1, p), n-n2, p);
    3538        8980 :     u = Flx_add(u, Flx_shift(Flxn_red(h, n-1), 1-n2), p);
    3539        8980 :     w = Flxn_mul(f, Flx_integXn(u, n2-1, p), n-n2, p);
    3540        8980 :     f = Flx_add(f, Flx_shift(w, n2), p);
    3541        8981 :     if (mask<=1) break;
    3542        6951 :     u = Flxn_mul(g, Flxn_mulhigh(f, g, n2, n, p), n-n2, p);
    3543        6951 :     g = Flx_sub(g, Flx_shift(u, n2), p);
    3544        6950 :     if (gc_needed(av2,2))
    3545             :     {
    3546           0 :       if (DEBUGMEM>1) pari_warn(warnmem,"Flxn_exp, e = %ld", n);
    3547           0 :       gerepileall(av2, 2, &f, &g);
    3548             :     }
    3549             :   }
    3550        2030 :   return gerepileupto(av, f);
    3551             : }
    3552             : 
    3553             : GEN
    3554           0 : Flxn_exp(GEN h, long e, ulong p)
    3555             : {
    3556           0 :   if (degpol(h)<1 || uel(h,2)!=0)
    3557           0 :     pari_err_DOMAIN("Flxn_exp","valuation", "<", gen_1, h);
    3558           0 :   return Flxn_expint(Flx_deriv(h, p), e, p);
    3559             : }
    3560             : 
    3561             : INLINE GEN
    3562        8419 : Flxn_recip(GEN x, long n)
    3563             : {
    3564        8419 :   GEN z=Flx_recipspec(x+2,lgpol(x),n);
    3565        8420 :   z[1]=x[1];
    3566        8420 :   return z;
    3567             : }
    3568             : 
    3569             : GEN
    3570        3196 : Flx_Newton(GEN P, long n, ulong p)
    3571             : {
    3572        3196 :   pari_sp av = avma;
    3573        3196 :   long d = degpol(P);
    3574        3196 :   GEN dP = Flxn_recip(Flx_deriv(P, p), d);
    3575        3195 :   GEN Q = Flxn_mul(Flxn_inv(Flxn_recip(P, d+1), n, p), dP, n, p);
    3576        3194 :   return gerepileuptoleaf(av, Q);
    3577             : }
    3578             : 
    3579             : GEN
    3580        2029 : Flx_fromNewton(GEN P, ulong p)
    3581             : {
    3582        2029 :   pari_sp av = avma;
    3583        2029 :   ulong n = Flx_constant(P)+1;
    3584        2029 :   GEN z = Flx_neg(Flx_shift(P, -1), p);
    3585        2029 :   GEN Q = Flxn_recip(Flxn_expint(z, n, p), n);
    3586        2030 :   return gerepileuptoleaf(av, Q);
    3587             : }
    3588             : 
    3589             : static long
    3590         434 : newtonlogint(ulong n, ulong pp)
    3591             : {
    3592         434 :   long s = 0;
    3593        1960 :   while (n > pp)
    3594             :   {
    3595        1526 :     s += ulogint(n, pp);
    3596        1526 :     n = (n+1)>>1;
    3597             :   }
    3598         434 :   return s;
    3599             : }
    3600             : 
    3601             : static void
    3602         655 : init_invlaplace(long d, ulong p, GEN *pt_P, GEN *pt_V)
    3603             : {
    3604             :   long i;
    3605             :   ulong e;
    3606         655 :   GEN P = cgetg(d+1, t_VECSMALL);
    3607         655 :   GEN V = cgetg(d+1, t_VECSMALL);
    3608       27292 :   for (i=1, e=1; i<=d; i++, e++)
    3609             :   {
    3610       26637 :     if (e==p)
    3611             :     {
    3612        9512 :       e = 0;
    3613        9512 :       V[i] = u_lvalrem(i, p, &uel(P,i));
    3614             :     } else
    3615             :     {
    3616       17125 :       V[i] = 0; uel(P,i) = i;
    3617             :     }
    3618             :   }
    3619         655 :   *pt_P = P; *pt_V = V;
    3620         655 : }
    3621             : 
    3622             : /* return p^val * FpX_invLaplace(1+x+...x^(n-1), q), with q a power of p and
    3623             :  * val large enough to compensate for the power of p in the factorials */
    3624             : 
    3625             : static GEN
    3626         434 : ZpX_invLaplace_init(long n, GEN q, ulong p, long v, long var)
    3627             : {
    3628         434 :   pari_sp av = avma;
    3629         434 :   long i, d = n-1, w;
    3630             :   GEN y, W, E, t;
    3631         434 :   init_invlaplace(d, p, &E, &W);
    3632         434 :   t = Fp_inv(FpV_prod(Flv_to_ZV(E), q), q);
    3633         434 :   w = zv_sum(W);
    3634         434 :   if (v > w) t = Fp_mul(t, powuu(p, v-w), q);
    3635         434 :   y = cgetg(d+3,t_POL);
    3636         434 :   y[1] = evalsigne(1) | evalvarn(var);
    3637       21203 :   for (i=d; i>=1; i--)
    3638             :   {
    3639       20769 :     gel(y,i+2) = t;
    3640       20769 :     t = Fp_mulu(t, uel(E,i), q);
    3641       20769 :     if (uel(W,i)) t = Fp_mul(t, powuu(p, uel(W,i)), q);
    3642             :   }
    3643         434 :   gel(y,2) = t;
    3644         434 :   return gerepilecopy(av, ZX_renormalize(y, d+3));
    3645             : }
    3646             : 
    3647             : static GEN
    3648        2032 : Flx_composedsum(GEN P, GEN Q, ulong p)
    3649             : {
    3650        2032 :   long n = 1 + degpol(P)*degpol(Q);
    3651        2032 :   ulong lead = Fl_mul(Fl_powu(Flx_lead(P), degpol(Q), p),
    3652        2032 :                       Fl_powu(Flx_lead(Q), degpol(P), p), p);
    3653             :   GEN R;
    3654        2032 :   if (p >= (ulong)n)
    3655             :   {
    3656        1598 :     GEN Pl = Flx_invLaplace(Flx_Newton(P,n,p), p);
    3657        1598 :     GEN Ql = Flx_invLaplace(Flx_Newton(Q,n,p), p);
    3658        1597 :     GEN L  = Flx_Laplace(Flxn_mul(Pl, Ql, n, p), p);
    3659        1597 :     R = Flx_fromNewton(L, p);
    3660             :   } else
    3661             :   {
    3662         434 :     long v = factorial_lval(n-1, p);
    3663         434 :     long w = 1 + newtonlogint(n-1, p);
    3664         434 :     GEN pv = powuu(p, v);
    3665         434 :     GEN qf = powuu(p, w), q = mulii(pv, qf), q2 = mulii(q, pv);
    3666         434 :     GEN iL = ZpX_invLaplace_init(n, q, p, v, varn(P));
    3667         434 :     GEN Pl = FpX_convol(iL, FpX_Newton(Flx_to_ZX(P), n, qf), q);
    3668         434 :     GEN Ql = FpX_convol(iL, FpX_Newton(Flx_to_ZX(Q), n, qf), q);
    3669         434 :     GEN Ln = ZX_Z_divexact(FpXn_mul(Pl, Ql, n, q2), pv);
    3670         434 :     GEN L  = ZX_Z_divexact(FpX_Laplace(Ln, q), pv);
    3671         434 :     R = ZX_to_Flx(FpX_fromNewton(L, qf), p);
    3672             :   }
    3673        2032 :   return Flx_Fl_mul(R, lead, p);
    3674             : }
    3675             : 
    3676             : GEN
    3677        2032 : Flx_direct_compositum(GEN a, GEN b, ulong p)
    3678             : {
    3679        2032 :   return Flx_composedsum(a, b, p);
    3680             : }
    3681             : 
    3682             : static GEN
    3683         628 : _Flx_direct_compositum(void *E, GEN a, GEN b)
    3684         628 : { return Flx_direct_compositum(a, b, (ulong)E); }
    3685             : 
    3686             : GEN
    3687        5219 : FlxV_direct_compositum(GEN V, ulong p)
    3688             : {
    3689        5219 :   return gen_product(V, (void *)p, &_Flx_direct_compositum);
    3690             : }
    3691             : 
    3692             : /* (x+1)^n mod p; assume 2 <= n < 2p prime */
    3693             : static GEN
    3694           0 : Fl_Xp1_powu(ulong n, ulong p, long v)
    3695             : {
    3696           0 :   ulong k, d = (n + 1) >> 1;
    3697           0 :   GEN C, V = identity_zv(d);
    3698             : 
    3699           0 :   Flv_inv_inplace(V, p); /* could restrict to odd integers in [3,d] */
    3700           0 :   C = cgetg(n+3, t_VECSMALL);
    3701           0 :   C[1] = v;
    3702           0 :   uel(C,2) = 1UL;
    3703           0 :   uel(C,3) = n%p;
    3704           0 :   uel(C,4) = Fl_mul(odd(n)? n: n-1, n >> 1, p);
    3705             :     /* binom(n,k) = binom(n,k-1) * (n-k+1) / k */
    3706           0 :   if (SMALL_ULONG(p))
    3707           0 :     for (k = 3; k <= d; k++)
    3708           0 :       uel(C,k+2) = Fl_mul(Fl_mul(n-k+1, uel(C,k+1), p), uel(V,k), p);
    3709             :   else
    3710             :   {
    3711           0 :     ulong pi  = get_Fl_red(p);
    3712           0 :     for (k = 3; k <= d; k++)
    3713           0 :       uel(C,k+2) = Fl_mul_pre(Fl_mul(n-k+1, uel(C,k+1), p), uel(V,k), p, pi);
    3714             :   }
    3715           0 :   for (   ; k <= n; k++) uel(C,2+k) = uel(C,2+n-k);
    3716           0 :   return C; /* normalized */
    3717             : }
    3718             : 
    3719             : /* p arbitrary */
    3720             : GEN
    3721       13280 : Flx_translate1_basecase(GEN P, ulong p)
    3722             : {
    3723       13280 :   GEN R = Flx_copy(P);
    3724       13280 :   long i, k, n = degpol(P);
    3725       72869 :   for (i = 1; i <= n; i++)
    3726      498605 :     for (k = n-i; k < n; k++) uel(R,k+2) = Fl_add(uel(R,k+2), uel(R,k+3), p);
    3727       13280 :   return R;
    3728             : }
    3729             : 
    3730             : static int
    3731       13501 : translate_basecase(long n, ulong p)
    3732             : {
    3733             : #ifdef LONG_IS_64BIT
    3734       11589 :   if (p <= 19) return n < 40;
    3735        8031 :   if (p < 1UL<<30) return n < 58;
    3736           0 :   if (p < 1UL<<59) return n < 100;
    3737           0 :   if (p < 1UL<<62) return n < 120;
    3738           0 :   if (p < 1UL<<63) return n < 240;
    3739           0 :   return n < 250;
    3740             : #else
    3741        1912 :   if (p <= 13) return n < 18;
    3742        1428 :   if (p <= 17) return n < 22;
    3743        1376 :   if (p <= 29) return n < 39;
    3744        1202 :   if (p <= 67) return n < 69;
    3745         983 :   if (p < 1UL<< 15) return n < 80;
    3746           0 :   if (p < 1UL<< 16) return n < 100;
    3747           0 :   if (p < 1UL<< 28) return n < 300;
    3748           0 :   return n < 650;
    3749             : #endif
    3750             : }
    3751             : /* assume p prime */
    3752             : GEN
    3753       11848 : Flx_translate1(GEN P, ulong p)
    3754             : {
    3755       11848 :   long d, n = degpol(P);
    3756             :   GEN R, Q, S;
    3757       11848 :   if (translate_basecase(n, p)) return Flx_translate1_basecase(P, p);
    3758             :   /* n > 0 */
    3759           0 :   d = n >> 1;
    3760           0 :   if ((ulong)n < p)
    3761             :   {
    3762           0 :     R = Flx_translate1(Flxn_red(P, d), p);
    3763           0 :     Q = Flx_translate1(Flx_shift(P, -d), p);
    3764           0 :     S = Fl_Xp1_powu(d, p, P[1]);
    3765           0 :     return Flx_add(Flx_mul(Q, S, p), R, p);
    3766             :   }
    3767             :   else
    3768             :   {
    3769             :     ulong q;
    3770           0 :     if ((ulong)d > p) (void)ulogintall(d, p, &q); else q = p;
    3771           0 :     R = Flx_translate1(Flxn_red(P, q), p);
    3772           0 :     Q = Flx_translate1(Flx_shift(P, -q), p);
    3773           0 :     S = Flx_add(Flx_shift(Q, q), Q, p);
    3774           0 :     return Flx_add(S, R, p); /* P(x+1) = Q(x+1) (x^q+1) + R(x+1) */
    3775             :   }
    3776             : }
    3777             : 
    3778             : static GEN
    3779         221 : zl_Xp1_powu(ulong n, ulong p, ulong q, long e, long vs)
    3780             : {
    3781         221 :   ulong k, d = n >> 1, c, v = 0;
    3782         221 :   GEN C, V, W, U = upowers(p, e-1);
    3783         221 :   init_invlaplace(d, p, &V, &W);
    3784         221 :   Flv_inv_inplace(V, q);
    3785         221 :   C = cgetg(n+3, t_VECSMALL);
    3786         221 :   C[1] = vs;
    3787         221 :   uel(C,2) = 1UL;
    3788         221 :   uel(C,3) = n%q;
    3789         221 :   v = u_lvalrem(n, p, &c);
    3790        5868 :   for (k = 2; k <= d; k++)
    3791             :   {
    3792             :     ulong w;
    3793        5647 :     v += u_lvalrem(n-k+1, p, &w) - W[k];
    3794        5647 :     c = Fl_mul(Fl_mul(w%q, c, q), uel(V,k), q);
    3795        5647 :     uel(C,2+k) = v >= (ulong)e ? 0: v==0 ? c : Fl_mul(c, uel(U, v+1), q);
    3796             :   }
    3797        6160 :   for (   ; k <= n; k++) uel(C,2+k) = uel(C,2+n-k);
    3798         221 :   return C; /* normalized */
    3799             : }
    3800             : 
    3801             : GEN
    3802        1653 : zlx_translate1(GEN P, ulong p, long e)
    3803             : {
    3804        1653 :   ulong d, q = upowuu(p,e), n = degpol(P);
    3805             :   GEN R, Q, S;
    3806        1653 :   if (translate_basecase(n, q)) return Flx_translate1_basecase(P, q);
    3807             :   /* n > 0 */
    3808         221 :   d = n >> 1;
    3809         221 :   R = zlx_translate1(Flxn_red(P, d), p, e);
    3810         221 :   Q = zlx_translate1(Flx_shift(P, -d), p, e);
    3811         221 :   S = zl_Xp1_powu(d, p, q, e, P[1]);
    3812         221 :   return Flx_add(Flx_mul(Q, S, q), R, q);
    3813             : }
    3814             : 
    3815             : /***********************************************************************/
    3816             : /**                                                                   **/
    3817             : /**                               Fl2                                 **/
    3818             : /**                                                                   **/
    3819             : /***********************************************************************/
    3820             : /* Fl2 objects are Flv of length 2 [a,b] representing a+bsqrt(D) for
    3821             :    a non-square D.
    3822             : */
    3823             : 
    3824             : INLINE GEN
    3825     6263817 : mkF2(ulong a, ulong b) { return mkvecsmall2(a,b); }
    3826             : 
    3827             : GEN
    3828     1682213 : Fl2_mul_pre(GEN x, GEN y, ulong D, ulong p, ulong pi)
    3829             : {
    3830             :   ulong xaya, xbyb, Db2, mid;
    3831             :   ulong z1, z2;
    3832     1682213 :   ulong x1 = x[1], x2 = x[2], y1 = y[1], y2 = y[2];
    3833     1682213 :   xaya = Fl_mul_pre(x1,y1,p,pi);
    3834     1682276 :   if (x2==0 && y2==0) return mkF2(xaya,0);
    3835     1627759 :   if (x2==0) return mkF2(xaya,Fl_mul_pre(x1,y2,p,pi));
    3836     1606853 :   if (y2==0) return mkF2(xaya,Fl_mul_pre(x2,y1,p,pi));
    3837     1606597 :   xbyb = Fl_mul_pre(x2,y2,p,pi);
    3838     1606577 :   mid = Fl_mul_pre(Fl_add(x1,x2,p), Fl_add(y1,y2,p),p,pi);
    3839     1606619 :   Db2 = Fl_mul_pre(D, xbyb, p,pi);
    3840     1606610 :   z1 = Fl_add(xaya,Db2,p);
    3841     1606610 :   z2 = Fl_sub(mid,Fl_add(xaya,xbyb,p),p);
    3842     1606596 :   return mkF2(z1,z2);
    3843             : }
    3844             : 
    3845             : GEN
    3846     4243642 : Fl2_sqr_pre(GEN x, ulong D, ulong p, ulong pi)
    3847             : {
    3848     4243642 :   ulong a = x[1], b = x[2];
    3849             :   ulong a2, Db2, ab;
    3850     4243642 :   a2 = Fl_sqr_pre(a,p,pi);
    3851     4244019 :   if (b==0) return mkF2(a2,0);
    3852     4067443 :   Db2= Fl_mul_pre(D, Fl_sqr_pre(b,p,pi), p,pi);
    3853     4067502 :   ab = Fl_mul_pre(a,b,p,pi);
    3854     4067520 :   return mkF2(Fl_add(a2,Db2,p), Fl_double(ab,p));
    3855             : }
    3856             : 
    3857             : ulong
    3858       66392 : Fl2_norm_pre(GEN x, ulong D, ulong p, ulong pi)
    3859             : {
    3860       66392 :   ulong a2 = Fl_sqr_pre(x[1],p,pi);
    3861       66392 :   return x[2]? Fl_sub(a2, Fl_mul_pre(D, Fl_sqr_pre(x[2], p,pi), p,pi), p): a2;
    3862             : }
    3863             : 
    3864             : GEN
    3865      167109 : Fl2_inv_pre(GEN x, ulong D, ulong p, ulong pi)
    3866             : {
    3867             :   ulong n, ni;
    3868      167109 :   if (x[2] == 0) return mkF2(Fl_inv(x[1],p),0);
    3869      142919 :   n = Fl_sub(Fl_sqr_pre(x[1], p,pi),
    3870      142919 :              Fl_mul_pre(D, Fl_sqr_pre(x[2], p,pi), p,pi), p);
    3871      142919 :   ni = Fl_inv(n,p);
    3872      142919 :   return mkF2(Fl_mul_pre(x[1], ni, p,pi),
    3873      142919 :                Fl_neg(Fl_mul_pre(x[2], ni, p,pi), p));
    3874             : }
    3875             : 
    3876             : int
    3877      379684 : Fl2_equal1(GEN x) { return x[1]==1 && x[2]==0; }
    3878             : 
    3879             : struct _Fl2 {
    3880             :   ulong p, pi, D;
    3881             : };
    3882             : 
    3883             : static GEN
    3884     4243548 : _Fl2_sqr(void *data, GEN x)
    3885             : {
    3886     4243548 :   struct _Fl2 *D = (struct _Fl2*)data;
    3887     4243548 :   return Fl2_sqr_pre(x, D->D, D->p, D->pi);
    3888             : }
    3889             : static GEN
    3890     1654468 : _Fl2_mul(void *data, GEN x, GEN y)
    3891             : {
    3892     1654468 :   struct _Fl2 *D = (struct _Fl2*)data;
    3893     1654468 :   return Fl2_mul_pre(x,y, D->D, D->p, D->pi);
    3894             : }
    3895             : 
    3896             : /* n-Power of x in Z/pZ[X]/(T), as t_VECSMALL. */
    3897             : GEN
    3898      567820 : Fl2_pow_pre(GEN x, GEN n, ulong D, ulong p, ulong pi)
    3899             : {
    3900      567820 :   pari_sp av = avma;
    3901             :   struct _Fl2 d;
    3902             :   GEN y;
    3903      567820 :   long s = signe(n);
    3904      567820 :   if (!s) return mkF2(1,0);
    3905      503296 :   if (s < 0)
    3906      167109 :     x = Fl2_inv_pre(x,D,p,pi);
    3907      503296 :   if (is_pm1(n)) return s < 0 ? x : zv_copy(x);
    3908      370166 :   d.p = p; d.pi = pi; d.D=D;
    3909      370166 :   y = gen_pow_i(x, n, (void*)&d, &_Fl2_sqr, &_Fl2_mul);
    3910      370172 :   return gerepileuptoleaf(av, y);
    3911             : }
    3912             : 
    3913             : static GEN
    3914      567820 : _Fl2_pow(void *data, GEN x, GEN n)
    3915             : {
    3916      567820 :   struct _Fl2 *D = (struct _Fl2*)data;
    3917      567820 :   return Fl2_pow_pre(x, n, D->D, D->p, D->pi);
    3918             : }
    3919             : 
    3920             : static GEN
    3921       96478 : _Fl2_rand(void *data)
    3922             : {
    3923       96478 :   struct _Fl2 *D = (struct _Fl2*)data;
    3924       96478 :   ulong a = random_Fl(D->p), b=random_Fl(D->p-1)+1;
    3925       96478 :   return mkF2(a,b);
    3926             : }
    3927             : 
    3928             : static const struct bb_group Fl2_star={_Fl2_mul, _Fl2_pow, _Fl2_rand,
    3929             :        hash_GEN, zv_equal, Fl2_equal1, NULL};
    3930             : 
    3931             : GEN
    3932       64524 : Fl2_sqrtn_pre(GEN a, GEN n, ulong D, ulong p, ulong pi, GEN *zeta)
    3933             : {
    3934             :   struct _Fl2 E;
    3935             :   GEN o;
    3936       64524 :   if (a[1]==0 && a[2]==0)
    3937             :   {
    3938           0 :     if (signe(n) < 0) pari_err_INV("Flxq_sqrtn",a);
    3939           0 :     if (zeta) *zeta=mkF2(1,0);
    3940           0 :     return zv_copy(a);
    3941             :   }
    3942       64524 :   E.p=p; E.pi = pi; E.D = D;
    3943       64524 :   o = subiu(powuu(p,2), 1);
    3944       64524 :   return gen_Shanks_sqrtn(a,n,o,zeta,(void*)&E,&Fl2_star);
    3945             : }
    3946             : 
    3947             : GEN
    3948       10108 : Flx_Fl2_eval_pre(GEN x, GEN y, ulong D, ulong p, ulong pi)
    3949             : {
    3950             :   GEN p1;
    3951       10108 :   long i = lg(x)-1;
    3952       10108 :   if (i <= 2)
    3953        1883 :     return mkF2(i == 2? x[2]: 0, 0);
    3954        8225 :   p1 = mkF2(x[i], 0);
    3955       35952 :   for (i--; i>=2; i--)
    3956             :   {
    3957       27727 :     p1 = Fl2_mul_pre(p1, y, D, p, pi);
    3958       27727 :     uel(p1,1) = Fl_add(uel(p1,1), uel(x,i), p);
    3959             :   }
    3960        8225 :   return p1;
    3961             : }
    3962             : 
    3963             : /***********************************************************************/
    3964             : /**                                                                   **/
    3965             : /**                               FlxV                                **/
    3966             : /**                                                                   **/
    3967             : /***********************************************************************/
    3968             : /* FlxV are t_VEC with Flx coefficients. */
    3969             : 
    3970             : GEN
    3971           0 : FlxV_Flc_mul(GEN V, GEN W, ulong p)
    3972             : {
    3973           0 :   pari_sp ltop=avma;
    3974             :   long i;
    3975           0 :   GEN z = Flx_Fl_mul(gel(V,1),W[1],p);
    3976           0 :   for(i=2;i<lg(V);i++)
    3977           0 :     z=Flx_add(z,Flx_Fl_mul(gel(V,i),W[i],p),p);
    3978           0 :   return gerepileuptoleaf(ltop,z);
    3979             : }
    3980             : 
    3981             : GEN
    3982           0 : ZXV_to_FlxV(GEN x, ulong p)
    3983           0 : { pari_APPLY_type(t_VEC, ZX_to_Flx(gel(x,i), p)) }
    3984             : 
    3985             : GEN
    3986     1568319 : ZXT_to_FlxT(GEN x, ulong p)
    3987             : {
    3988     1568319 :   if (typ(x) == t_POL)
    3989     1506466 :     return ZX_to_Flx(x, p);
    3990             :   else
    3991      202596 :     pari_APPLY_type(t_VEC, ZXT_to_FlxT(gel(x,i), p))
    3992             : }
    3993             : 
    3994             : GEN
    3995       38437 : FlxV_to_Flm(GEN x, long n)
    3996      192437 : { pari_APPLY_type(t_MAT, Flx_to_Flv(gel(x,i), n)) }
    3997             : 
    3998             : GEN
    3999           0 : FlxV_red(GEN x, ulong p)
    4000           0 : { pari_APPLY_type(t_VEC, Flx_red(gel(x,i), p)) }
    4001             : 
    4002             : GEN
    4003      330313 : FlxT_red(GEN x, ulong p)
    4004             : {
    4005      330313 :   if (typ(x) == t_VECSMALL)
    4006      222107 :     return Flx_red(x, p);
    4007             :   else
    4008      362828 :     pari_APPLY_type(t_VEC, FlxT_red(gel(x,i), p))
    4009             : }
    4010             : 
    4011             : GEN
    4012      113505 : FlxqV_dotproduct(GEN x, GEN y, GEN T, ulong p)
    4013             : {
    4014      113505 :   long i, lx = lg(x);
    4015             :   pari_sp av;
    4016             :   GEN c;
    4017      113505 :   if (lx == 1) return pol0_Flx(get_Flx_var(T));
    4018      113505 :   av = avma; c = Flx_mul(gel(x,1),gel(y,1), p);
    4019      463799 :   for (i=2; i<lx; i++) c = Flx_add(c, Flx_mul(gel(x,i),gel(y,i), p), p);
    4020      113505 :   return gerepileuptoleaf(av, Flx_rem(c,T,p));
    4021             : }
    4022             : 
    4023             : GEN
    4024        1620 : FlxqX_dotproduct(GEN x, GEN y, GEN T, ulong p)
    4025             : {
    4026        1620 :   long i, l = minss(lg(x), lg(y));
    4027             :   pari_sp av;
    4028             :   GEN c;
    4029        1620 :   if (l == 2) return pol0_Flx(get_Flx_var(T));
    4030        1620 :   av = avma; c = Flx_mul(gel(x,2),gel(y,2), p);
    4031        4686 :   for (i=3; i<l; i++) c = Flx_add(c, Flx_mul(gel(x,i),gel(y,i), p), p);
    4032        1620 :   return gerepileuptoleaf(av, Flx_rem(c,T,p));
    4033             : }
    4034             : 
    4035             : GEN
    4036      218114 : FlxC_eval_powers_pre(GEN z, GEN x, ulong p, ulong pi)
    4037             : {
    4038      218114 :   long i, l = lg(z);
    4039      218114 :   GEN y = cgetg(l, t_VECSMALL);
    4040     7140695 :   for (i=1; i<l; i++)
    4041     6922415 :     uel(y,i) = Flx_eval_powers_pre(gel(z,i), x, p, pi);
    4042      218280 :   return y;
    4043             : }
    4044             : 
    4045             : /***********************************************************************/
    4046             : /**                                                                   **/
    4047             : /**                               FlxM                                **/
    4048             : /**                                                                   **/
    4049             : /***********************************************************************/
    4050             : 
    4051             : GEN
    4052       18130 : FlxM_eval_powers_pre(GEN z, GEN x, ulong p, ulong pi)
    4053             : {
    4054       18130 :   long i, l = lg(z);
    4055       18130 :   GEN y = cgetg(l, t_MAT);
    4056      236242 :   for (i=1; i<l; i++)
    4057      218113 :     gel(y,i) = FlxC_eval_powers_pre(gel(z,i), x, p, pi);
    4058       18129 :   return y;
    4059             : }
    4060             : 
    4061             : GEN
    4062           0 : zero_FlxC(long n, long sv)
    4063             : {
    4064             :   long i;
    4065           0 :   GEN x = cgetg(n + 1, t_COL);
    4066           0 :   GEN z = zero_Flx(sv);
    4067           0 :   for (i = 1; i <= n; i++)
    4068           0 :     gel(x, i) = z;
    4069           0 :   return x;
    4070             : }
    4071             : 
    4072             : GEN
    4073           0 : FlxC_neg(GEN x, ulong p)
    4074           0 : { pari_APPLY_type(t_COL, Flx_neg(gel(x, i), p)) }
    4075             : 
    4076             : GEN
    4077           0 : FlxC_sub(GEN x, GEN y, ulong p)
    4078           0 : { pari_APPLY_type(t_COL, Flx_sub(gel(x, i), gel(y, i), p)) }
    4079             : 
    4080             : GEN
    4081           0 : zero_FlxM(long r, long c, long sv)
    4082             : {
    4083             :   long j;
    4084           0 :   GEN x = cgetg(c + 1, t_MAT);
    4085           0 :   GEN z = zero_FlxC(r, sv);
    4086           0 :   for (j = 1; j <= c; j++)
    4087           0 :     gel(x, j) = z;
    4088           0 :   return x;
    4089             : }
    4090             : 
    4091             : GEN
    4092           0 : FlxM_neg(GEN x, ulong p)
    4093           0 : { pari_APPLY_same(FlxC_neg(gel(x, i), p)) }
    4094             : 
    4095             : GEN
    4096           0 : FlxM_sub(GEN x, GEN y, ulong p)
    4097           0 : { pari_APPLY_same(FlxC_sub(gel(x, i), gel(y,i), p)) }
    4098             : 
    4099             : GEN
    4100           0 : FlxqC_Flxq_mul(GEN x, GEN y, GEN T, ulong p)
    4101           0 : { pari_APPLY_type(t_COL, Flxq_mul(gel(x, i), y, T, p)) }
    4102             : 
    4103             : GEN
    4104           0 : FlxqM_Flxq_mul(GEN x, GEN y, GEN T, ulong p)
    4105           0 : { pari_APPLY_same(FlxqC_Flxq_mul(gel(x, i), y, T, p)) }
    4106             : 
    4107             : static GEN
    4108       51426 : FlxM_pack_ZM(GEN M, GEN (*pack)(GEN, long)) {
    4109             :   long i, j, l, lc;
    4110       51426 :   GEN N = cgetg_copy(M, &l), x;
    4111       51426 :   if (l == 1)
    4112           0 :     return N;
    4113       51426 :   lc = lgcols(M);
    4114      244378 :   for (j = 1; j < l; j++) {
    4115      192952 :     gel(N, j) = cgetg(lc, t_COL);
    4116     1111355 :     for (i = 1; i < lc; i++) {
    4117      918403 :       x = gcoeff(M, i, j);
    4118      918403 :       gcoeff(N, i, j) = pack(x + 2, lgpol(x));
    4119             :     }
    4120             :   }
    4121       51426 :   return N;
    4122             : }
    4123             : 
    4124             : static GEN
    4125      853904 : kron_pack_Flx_spec_half(GEN x, long l) {
    4126      853904 :   if (l == 0)
    4127      306078 :     return gen_0;
    4128      547826 :   return Flx_to_int_halfspec(x, l);
    4129             : }
    4130             : 
    4131             : static GEN
    4132       61110 : kron_pack_Flx_spec(GEN x, long l) {
    4133             :   long i;
    4134             :   GEN w, y;
    4135       61110 :   if (l == 0)
    4136       12281 :     return gen_0;
    4137       48829 :   y = cgetipos(l + 2);
    4138      167749 :   for (i = 0, w = int_LSW(y); i < l; i++, w = int_nextW(w))
    4139      118920 :     *w = x[i];
    4140       48829 :   return y;
    4141             : }
    4142             : 
    4143             : static GEN
    4144        3389 : kron_pack_Flx_spec_2(GEN x, long l) {
    4145        3389 :   return Flx_eval2BILspec(x, 2, l);
    4146             : }
    4147             : 
    4148             : static GEN
    4149           0 : kron_pack_Flx_spec_3(GEN x, long l) {
    4150           0 :   return Flx_eval2BILspec(x, 3, l);
    4151             : }
    4152             : 
    4153             : static GEN
    4154       53092 : kron_unpack_Flx(GEN z, ulong p)
    4155             : {
    4156       53092 :   long i, l = lgefint(z);
    4157       53092 :   GEN x = cgetg(l, t_VECSMALL), w;
    4158      220146 :   for (w = int_LSW(z), i = 2; i < l; w = int_nextW(w), i++)
    4159      167054 :     x[i] = ((ulong) *w) % p;
    4160       53092 :   return Flx_renormalize(x, l);
    4161             : }
    4162             : 
    4163             : static GEN
    4164        2930 : kron_unpack_Flx_2(GEN x, ulong p) {
    4165        2930 :   long d = (lgefint(x)-1)/2 - 1;
    4166        2930 :   return Z_mod2BIL_Flx_2(x, d, p);
    4167             : }
    4168             : 
    4169             : static GEN
    4170           0 : kron_unpack_Flx_3(GEN x, ulong p) {
    4171           0 :   long d = lgefint(x)/3 - 1;
    4172           0 :   return Z_mod2BIL_Flx_3(x, d, p);
    4173             : }
    4174             : 
    4175             : static GEN
    4176      116725 : FlxM_pack_ZM_bits(GEN M, long b)
    4177             : {
    4178             :   long i, j, l, lc;
    4179      116725 :   GEN N = cgetg_copy(M, &l), x;
    4180      116725 :   if (l == 1)
    4181           0 :     return N;
    4182      116725 :   lc = lgcols(M);
    4183      488835 :   for (j = 1; j < l; j++) {
    4184      372110 :     gel(N, j) = cgetg(lc, t_COL);
    4185     5969500 :     for (i = 1; i < lc; i++) {
    4186     5597390 :       x = gcoeff(M, i, j);
    4187     5597390 :       gcoeff(N, i, j) = kron_pack_Flx_spec_bits(x + 2, b, lgpol(x));
    4188             :     }
    4189             :   }
    4190      116725 :   return N;
    4191             : }
    4192             : 
    4193             : static GEN
    4194       25713 : ZM_unpack_FlxqM(GEN M, GEN T, ulong p, GEN (*unpack)(GEN, ulong))
    4195             : {
    4196       25713 :   long i, j, l, lc, sv = get_Flx_var(T);
    4197       25713 :   GEN N = cgetg_copy(M, &l), x;
    4198       25713 :   if (l == 1)
    4199           0 :     return N;
    4200       25713 :   lc = lgcols(M);
    4201      141664 :   for (j = 1; j < l; j++) {
    4202      115951 :     gel(N, j) = cgetg(lc, t_COL);
    4203      844283 :     for (i = 1; i < lc; i++) {
    4204      728332 :       x = unpack(gcoeff(M, i, j), p);
    4205      728332 :       x[1] = sv;
    4206      728332 :       gcoeff(N, i, j) = Flx_rem(x, T, p);
    4207             :     }
    4208             :   }
    4209       25713 :   return N;
    4210             : }
    4211             : 
    4212             : static GEN
    4213       58403 : ZM_unpack_FlxqM_bits(GEN M, long b, GEN T, ulong p)
    4214             : {
    4215       58403 :   long i, j, l, lc, sv = get_Flx_var(T);
    4216       58403 :   GEN N = cgetg_copy(M, &l), x;
    4217       58403 :   if (l == 1)
    4218           0 :     return N;
    4219       58403 :   lc = lgcols(M);
    4220       58403 :   if (b < BITS_IN_LONG) {
    4221      205972 :     for (j = 1; j < l; j++) {
    4222      148673 :       gel(N, j) = cgetg(lc, t_COL);
    4223     3426954 :       for (i = 1; i < lc; i++) {
    4224     3278281 :         x = kron_unpack_Flx_bits_narrow(gcoeff(M, i, j), b, p);
    4225     3278281 :         x[1] = sv;
    4226     3278281 :         gcoeff(N, i, j) = Flx_rem(x, T, p);
    4227             :       }
    4228             :     }
    4229             :   } else {
    4230        1104 :     ulong pi = get_Fl_red(p);
    4231        7422 :     for (j = 1; j < l; j++) {
    4232        6318 :       gel(N, j) = cgetg(lc, t_COL);
    4233      135683 :       for (i = 1; i < lc; i++) {
    4234      129365 :         x = kron_unpack_Flx_bits_wide(gcoeff(M, i, j), b, p, pi);
    4235      129365 :         x[1] = sv;
    4236      129365 :         gcoeff(N, i, j) = Flx_rem(x, T, p);
    4237             :       }
    4238             :     }
    4239             :   }
    4240       58403 :   return N;
    4241             : }
    4242             : 
    4243             : GEN
    4244       84116 : FlxqM_mul_Kronecker(GEN A, GEN B, GEN T, ulong p)
    4245             : {
    4246       84116 :   pari_sp av = avma;
    4247       84116 :   long b, d = get_Flx_degree(T), n = lg(A) - 1;
    4248             :   GEN C, D, z;
    4249             :   GEN (*pack)(GEN, long), (*unpack)(GEN, ulong);
    4250       84116 :   int is_sqr = A==B;
    4251             : 
    4252       84116 :   z = muliu(muliu(sqru(p - 1), d), n);
    4253       84116 :   b = expi(z) + 1;
    4254             :   /* only do expensive bit-packing if it saves at least 1 limb */
    4255       84116 :   if (b <= BITS_IN_HALFULONG) {
    4256       80325 :     if (nbits2nlong(d*b) == (d + 1)/2)
    4257       24720 :       b = BITS_IN_HALFULONG;
    4258             :   } else {
    4259        3791 :     long l = lgefint(z) - 2;
    4260        3791 :     if (nbits2nlong(d*b) == d*l)
    4261         993 :       b = l*BITS_IN_LONG;
    4262             :   }
    4263       84116 :   set_avma(av);
    4264             : 
    4265       84116 :   switch (b) {
    4266       24720 :   case BITS_IN_HALFULONG:
    4267       24720 :     pack = kron_pack_Flx_spec_half;
    4268       24720 :     unpack = int_to_Flx_half;
    4269       24720 :     break;
    4270         944 :   case BITS_IN_LONG:
    4271         944 :     pack = kron_pack_Flx_spec;
    4272         944 :     unpack = kron_unpack_Flx;
    4273         944 :     break;
    4274          49 :   case 2*BITS_IN_LONG:
    4275          49 :     pack = kron_pack_Flx_spec_2;
    4276          49 :     unpack = kron_unpack_Flx_2;
    4277          49 :     break;
    4278           0 :   case 3*BITS_IN_LONG:
    4279           0 :     pack = kron_pack_Flx_spec_3;
    4280           0 :     unpack = kron_unpack_Flx_3;
    4281           0 :     break;
    4282       58403 :   default:
    4283       58403 :     A = FlxM_pack_ZM_bits(A, b);
    4284       58403 :     B = is_sqr? A: FlxM_pack_ZM_bits(B, b);
    4285       58403 :     C = ZM_mul(A, B);
    4286       58403 :     D = ZM_unpack_FlxqM_bits(C, b, T, p);
    4287       58403 :     return gerepilecopy(av, D);
    4288             :   }
    4289       25713 :   A = FlxM_pack_ZM(A, pack);
    4290       25713 :   B = is_sqr? A: FlxM_pack_ZM(B, pack);
    4291       25713 :   C = ZM_mul(A, B);
    4292       25713 :   D = ZM_unpack_FlxqM(C, T, p, unpack);
    4293       25713 :   return gerepilecopy(av, D);
    4294             : }

Generated by: LCOV version 1.13