Source code for kona.linalg.matrices.hessian.lsr1

import gc
import numpy

from kona.options import get_opt

from kona.linalg.matrices.hessian.basic import QuasiNewtonApprox

[docs]class LimitedMemorySR1(QuasiNewtonApprox):
    """ Limited memory symmetric rank-one update

    Attributes
    ----------
    lambda0 : float
        ?
    threshold : float
        ?
    """

    def __init__(self, vector_factory, optns=None):
        super(LimitedMemorySR1, self).__init__(vector_factory, optns)

        self.lambda0 = 0

        self.threshold = 1.e-8

        self.max_stored = get_opt(self.optns, 10, 'max_stored')

        vector_factory.request_num_vectors(3*self.max_stored + 4)

    def _check_threshold(self, z_list, k, alpha):
        # alias some variables
        lambda0 = self.lambda0
        norm_init = self.norm_init
        s_list = self.s_list
        y_list = self.y_list
        threshold = self.threshold

        alpha[k] = (1.0 - lambda0)*z_list[k].inner(y_list[k]) + \
            lambda0*norm_init*z_list[k].inner(s_list[k])
        norm_grad = (1.0 - lambda0)**2*y_list[k].inner(y_list[k]) + \
            lambda0**2*norm_init**2*s_list[k].inner(s_list[k]) + \
            2.0*lambda0*norm_init*(1.0 - lambda0)*y_list[k].inner(s_list[k])
        norm_grad = numpy.sqrt(norm_grad)

        if abs(alpha[k]) < threshold * norm_grad * z_list[k].norm2 or \
                abs(alpha[k]) < numpy.finfo(float).eps:
            alpha[k] = 0.0
        else:
            alpha[k] = 1.0 / alpha[k]

        return alpha

[docs]    def add_correction(self, s_in, y_in):
        """
        Add the step and change in gradient to the lists storing the history.
        """
        threshold = self.threshold

        y_copy = self.vec_fac.generate()
        tmp = self.vec_fac.generate()
        y_copy.equals(y_in)
        self.product(y_copy, tmp)
        tmp.minus(s_in)

        norm_resid = tmp.norm2
        norm_y_new = y_in.norm2
        prod = abs(y_in.inner(tmp))

        if prod < threshold*norm_resid*norm_y_new or \
                prod < numpy.finfo(float).eps:
            self.out_file.write(
                'LimitedMemorySR1::AddCorrection():' +
                'correction skipped due to threshold condition.\n')
            return

        # if maximum is reached, remove old elements
        if len(self.s_list) == self.max_stored:
            del self.s_list[0]
            del self.y_list[0]

        # generate two new vectors
        s_new = self.vec_fac.generate()
        y_new = self.vec_fac.generate()

        # set them equal to the new correction
        s_new.equals(s_in)
        y_new.equals(y_in)

        # add the corrections to the list
        self.s_list.append(s_new)
        self.y_list.append(y_new)

        # force garbage collection
        del s_new, y_new
        gc.collect()

[docs]    def product(self, u_vec, v_vec):
        s_list = self.s_list
        y_list = self.y_list
        num_stored = len(s_list)

        Bs = []
        for k in xrange(num_stored):
            Bs.append(self.vec_fac.generate())
            Bs[k].equals(s_list[k])

        v_vec.equals(u_vec)

        for i in xrange(num_stored):
            denom = 1.0 / (y_list[i].inner(s_list[i]) - Bs[i].inner(s_list[i]))
            fac = (y_list[i].inner(u_vec) - Bs[i].inner(u_vec))*denom
            v_vec.equals_ax_p_by(1.0, v_vec, fac, y_list[i])
            v_vec.equals_ax_p_by(1.0, v_vec, -fac, Bs[i])
            for j in xrange(i+1, num_stored):
                fac = (y_list[i].inner(s_list[j])
                       - Bs[i].inner(s_list[j]))*denom
                Bs[j].equals_ax_p_by(1.0, Bs[j], fac, y_list[i])
                Bs[j].equals_ax_p_by(1.0, Bs[j], -fac, Bs[i])

[docs]    def solve(self, u_vec, v_vec, rel_tol=1e-15):
        # alias some variables
        lambda0 = self.lambda0
        norm_init = self.norm_init
        s_list = self.s_list
        y_list = self.y_list
        num_stored = len(s_list)

        if num_stored == 0:
            v_vec.equals(u_vec)
            v_vec.divide_by(norm_init)
            return

        alpha = numpy.zeros(num_stored)

        z_list = []
        for k in xrange(num_stored):
            z_list.append(self.vec_fac.generate())
            z_list[k].equals_ax_p_by(1.0 - lambda0, s_list[k],
                                     (lambda0 - 1.0)/norm_init,
                                     y_list[k])

        alpha = self._check_threshold(z_list, 0, alpha)

        for i in xrange(1, num_stored):
            for j in xrange(1, num_stored):
                prod = (1.0 - lambda0) * z_list[i-1].inner(y_list[j]) + \
                    lambda0 * norm_init * z_list[i-1].inner(s_list[j])
                z_list[j].equals_ax_p_by(1.0, z_list[j],
                                         -alpha[i-1] * prod, z_list[i-1])

            alpha = self._check_threshold(z_list, i, alpha)

        v_vec.equals(u_vec)
        for k in xrange(num_stored):
            v_vec.equals_ax_p_by(1.0, v_vec,
                                 alpha[k] * z_list[k].inner(u_vec), z_list[k])